Σχετ: Εισαγωγή δεδομένων σε R commander
Kostas Oikonomou
kikonomou at yahoo.gr
Sun Oct 14 14:24:34 UTC 2012
________________________________
Απο: Simos Xenitellis <simos.lists at googlemail.com>
Προς: Kostas Oikonomou <kikonomou at yahoo.gr>
Κοιν.: Ubuntu-gr <Ubuntu-gr at lists.ubuntu.com>
Στάλθηκε: 4:27 μ.μ. Κυριακή, 14 Οκτωβρίου 2012
Θεμα: Re: Εισαγωγή δεδομένων σε R commander
(Απαντώ και στη λίστα)
2012/10/14 Kostas Oikonomou <kikonomou at yahoo.gr>:
>
>
> ________________________________
> Απο: Simos Xenitellis <simos.lists at googlemail.com>
> Προς: Kostas Oikonomou <kikonomou at yahoo.gr>
> Κοιν.: Ubuntu Λίστα <ubuntu-gr at lists.ubuntu.com>
> Στάλθηκε: 7:19 μ.μ. Σάββατο, 13 Οκτωβρίου 2012
> Θεμα: Re: Εισαγωγή δεδομένων σε R commander
>
> 2012/10/13 Kostas Oikonomou <kikonomou at yahoo.gr>:
>>
>> Εν κατακλίδει κάτι δεν γίνεται σωστά με την κωδικοποίηση των Ελληνικών
>> χαρακτήρων. Δεν ξέρω βέβαια και αν η εισαγωγή αρχείου calculus θα λύσει το
>> πρόβλημα. Καλό θα ήταν η μεταφορά των δεδομένων από calculus να μην περνά
>> από excel και SPSS (προγράμματα κλειστού λογισμικού).
>>
>>
>> 1. Έχει κανένας καμμιά ιδέα πως διορθώνω την κωδικοποίηση των Ελληνικών
>> χαρακτήρων;
>
> Έχει σημασία το πως εμφανίζονται (εσφαλμένα) οι ελληνικοί χαρακτήρες
> στο R Commander για να μάθουμε τι ακριβώς πρόβλημα υπάρχει. Μπορείς να
> βάλεις ένα δείγμα αρχείου .sav στο pastebin.ubuntu-gr.org για να
> δοκιμάσουμε; Εξήγησε τι πρέπει να γίνει για να δοκιμαστεί το αρχείο,
> αφού φορτωθεί.
>
> Υπάρχει η λίστα r-help στα αγγλικά, και έγινε εκεί συζήτηση πριν από
> μερικά χρόνια,
> http://r.789695.n4.nabble.com/R-read-spss-and-encodings-td817472.html
> Στη συζήτηση δεν υπήρξε κάποιο αποτέλεσμα, και δεν ξέρω αν υπάρχει
> κάτι άλλο πιο πρόσφατο.
> Το βέλτιστο θα ήταν να γίνει μια ερώτηση και για την τρέχουσα κατάσταση.
>
> Το Rcmdr είναι γραμμένο σε TCL/TK, που ενδέχεται να μην έχει καλή
> υποστήριξη Unicode. Ακόμα, το άλλο ζητούμενο είναι αν το R δέχεται
> αλφαρηθμιτικά σε UTF-8.
>
> Οπότε,
> 1. βάλε στο pastebin.ubuntu-gr.org ένα μικρό δοκιμαστικό αρχείο και
> εξήγησε τι πρέπει να κάνουμε για να δούμε τα προβληματικά ελληνικά.
> 2. αν ξέρεις καλά αγγλικά, γράψου στην r-help και ρώτησε για την
> τρέχουσα κατάσταση σχετικά με Unicode και R.
>
> Σίμος
>
>
> Ευχαριστώ για την απάντηση και τις ιδέες. Δοκιμάζοντας να κάνω το
> δοκιμαστικό αρχείο είδα ότι αν κάνω εισαγωγή δεδομένων από το SPSS υπάρχει
> το πρόβλημα. Στη συνέχεια δοκίμασα τη δημιουργία αρχείου cvs (από το
> Calculus) και η μεταφορά του δοκιμαστικού αρχείου έγινε κανονικά,
> εμφανίζοντας μου σωστά και τα Ελληνικά.
>
Αυτό σημαίνει ότι ο R με το R Commander μάλλον δέχονται αλφαριθμητικά
σε Unicode (UTF-8).
Αυτό το SPSS είναι σε Windows; Αν ναι, τότε αντιμετωπίζεις το κλασσικό
πρόβλημα που έχουμε όπου
τα κείμενα με ελληνικά σε Windows είναι στην κωδικοποιήση
windows-1253/iso-8859-7,
διότι με τα ελληνικά Windows υπάρχει ειδική επιλογή για legacy
encoding με τιμή windows-1253/iso-8859-7.
Αντιμετωπίζουμε το ίδιο με τα ελληνικά στους υπότιτλους, στα MP3 (IDv3
tag), και αλλού.
> Δοκίμασα να μεταφέρω τα πραγματικά μου δεδομένα στο R Commander όπου κάποιο
> πρόβλημα φαίνεται να έχει το αρχείο που δημιουργείται. Μου δίνει μήνυμα ότι
> έχω περισσότερες στήλες από αυτές που έχουν ονόματα. Πιθανό να φταίει το ότι
> σε κάποια πεδία έχω πολύ λίγα στοιχεία συμπληρωμένα. Το άλλο που μπέρδευε
> την κατάσταση ήταν ο χωρισμός των δεκαδικών που στα Ελληνικά γίνεται με
> κόμμα. Άρα θέλει προσοχή να δηλώσεις άλλο σύμβολο για διαχωριστή πεδίων.
>
Αν έχεις το ελληνικό περιβάλλον, τότε ο διαχωριστής ακέραιου/δεκαδικών
είναι το κόμμα.
Αν έχεις πρόβλημα με αυτό το ζήτημα όπου υπάρχει λογισμικό που δε
συμπεριφέρεται σωστά,
μπορείς να αλλάξεις στο Ubuntu σου ώστε, ακόμα και με ελληνικό
περιβάλλον, θα έχει ως διαχωριστικό την τελεία,
ή να το αλλάξεις να είναι έτσι μόνο για το R.
Είχαμε στο φόρουμ πρόσφατα μια τέτοια συζήτηση για το πως γίνεται,
https://forum.ubuntu-gr.org/viewtopic.php?p=264305
Δεν έχω καταλάβει την κατάσταση ώστε να προτείνω που ακριβώς να
αλλάξεις (είναι π.χ. το πρόβλημα στα αρχεία SPSS;)
> Συμπέρασμα είναι ότι το αρχείο που προσπαθώ να εισάγω έχει κάποιο πρόβλημα.
> Το σύστημα φαίνεται να δουλεύει σωστά.
>
> Επίσης η ομάδα δουλεύει ακόμα καλύτερα γιατί με τις συμβουλές της λύνει
> πραγματικά προβλήματα (στην προκειμένη περίπτωση ήταν σημαντική η συμβουλή
> να δοκιμάσω το ίδιο πράγμα με ένα πιο μικρό αρχείο).
>
> Ευχαρστώ πολύ
>
Σίμος
Κατ' αρχή συγγνώμη που ξέχασα να κοινοποιήσω την απάντηση μου στην ομάδα.
Πράγματι το SPSS είναι σε περιβάλλον Windows. Έτσι το πρόβλημα είναι μάλλον μεταξύ unicode (UTF-8) και 1253/iso-8859-7.
Πάντως όταν κάνεις εξαγωγή σε ένα αρχείο cvs έχεις την επιλογή να αλλάξεις την κωδικοποίηση. Συγκεκριμμένα στο Calculus έχεις τρεις επιλογές:
α. Ρύθμιση κωδικοποίησης (αν θα είναι Unicode UTF-8)
β. Διαχωριστής πεδίων (αν θα είναι κόμμα, τελεία, κενό, tab, ; ή :)
γ. Διαχωριστικό κειμένου (δεν μπορώ να καταλάβω τι ακριβώς κάνει)
και κάποια άλλα κουτάκια για να επιλέξεις/αποεπιλέξεις
Έτσι η λύση είναι είτε αυτή που αναφέρεται στο φορουμ, ή να είσαι προσεκτικός όταν πληκτρολογείς δεκαδικά, να βάζεις τελεία αντί για κόμμα. Άλλη λύση (δεν την έχω δουλέψει για να ξέρω τι προβλήματα παρουσιάζει, είναι να αλλάξεις το διαχωριστικό των πεδίων από κόμα σε tab ή κάτι άλλο).
Τώρα για το αρχείο που ήδη δουλεύω και δεν περνά στο R commander δεν ξέρω ποιο ακριβώς είναι το πρόβλημα. Πρόκειται για ένα πολύ μεγάλο αρχείο με 161 περιστατικά, όπου κάθε περιστατικό έχει 240 πεδία. Πολλά πεδία είναι κενά λόγω έλλειψης δεδομένων. Πιστεύω ότι αυτό πρέπει να δημιουργεί το πρόβλημα. Όπως και να έχει το θέμα, ήδη επεξεργάζομαι το αρχείο σε SPSS και θα ήταν πρόβλημα να ξαναξεκινήσω την επεξεργασία από την αρχή. Η ερώτηση έγινε κυρίως για μελλοντική χρήση. Όταν θα χρειαστώ να ξανακάνω στατιστική ανάλυση να ξέρω ότι τα
δεδομένα περνάνε στο R commander, για να το χρησιμοποιήσω.
Εξ' άλλου σε μια πιθανή δημοσίευση θα ήταν πολύ καλύτερο να αναφέρω ότι η στατιστική επεξεργασία έγινε με το R statistics-R commander παρά να αναφέρω ότι έγινε με το SPSS. Και αυτό για δυο λόγους:
1. Είναι τιμή, αλλά και υποχρέωση προς την ιδέα του ελεύθερου λογισμικού.
2. Στην απίθανη περίπτωση που κάποιος ζητήσει την άδεια χρήσης του SPSS, να μην ψάχνεις να βρεις κάποια άδεια να δείξεις, αλλά να είσαι ΠΛΗΡΩΣ ΝΟΜΙΜΟΣ.
Και πάλι σας ευχαριστώ πολύ.
Κώστας Οικονόμου
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <https://lists.ubuntu.com/archives/ubuntu-gr/attachments/20121014/7d1bdec1/attachment.html>
More information about the Ubuntu-gr
mailing list