Re: Εισαγωγή δεδομένων σε R commander

Simos Xenitellis simos.lists at googlemail.com
Sun Oct 14 13:27:31 UTC 2012


(Απαντώ και στη λίστα)

2012/10/14 Kostas Oikonomou <kikonomou at yahoo.gr>:
>
>
> ________________________________
> Απο: Simos Xenitellis <simos.lists at googlemail.com>
> Προς: Kostas Oikonomou <kikonomou at yahoo.gr>
> Κοιν.: Ubuntu Λίστα <ubuntu-gr at lists.ubuntu.com>
> Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
> Θεμα: Re: Εισαγωγή δεδομένων σε R commander
>
> 2012/10/13 Kostas Oikonomou <kikonomou at yahoo.gr>:
>>
>> Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
>> χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το
>> πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
>> από excel και SPSS (προγράμματα κλειστού λογισμικού).
>>
>>
>> 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
>> χαρακτήρων;
>
> Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
> στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
> βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
> δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
> αφού φορτωθεί.
>
> Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
> μερικά χρόνια,
> http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
> Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
> κάτι άλλο πιο πρόσφατο.
> Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.
>
> Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
> υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
> αλφαρηθμιτικά σε UTF-8.
>
> Οπότε,
> 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
> εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
> 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
> τρέχουσα κατάσταση σχετικά με Unicode και R.
>
> Σίμος
>
>
> Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
> δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
> το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
> Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
> εμφανίζοντας μου σωστά και τα Ελληνικά.
>

Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
σε Unicode (UTF-8).
Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
πρόβλημα που έχουμε όπου
τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
windows-1253/iso-8859-7,
διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
encoding με τιμή windows-1253/iso-8859-7.

Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
tag), και αλλού.

> Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο
> πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι
> έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι
> σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
> την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
> κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.
>

Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
είναι το κόμμα.
Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
συμπεριφέρεται σωστά,
μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
ή να το αλλάξεις να είναι έτσι μόνο για το R.

Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
https://forum.ubuntu-gr.org/viewtopic.php?p=264305

Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)

> Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα.
> Το σύστημα φαίνεται να δουλεύει σωστά.
>
> Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
> πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
> να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).
>
> Ευχαρστώ πολύ
>

Σίμος


More information about the Ubuntu-gr mailing list