Grstats Forum

Statistical Programming + Linux

Πήγαινε κάτω

Statistical Programming + Linux

Δημοσίευση από paterask Την / Το Τετ 9 Δεκ 2009 - 2:05

Πηγή : Statistical Programming +Linux

1. R. (ή S-Plus) Είναι ένα εξαιρετικά διαδεδομένο πρόγραμμα με πολυάριθμες λειτουργίες. Σχεδόν όποιο στατιστικό test ή διεργασία θέλετε το R την έχει, αφού με σχεδόν 1500 επιπλέον πακέτα είναι δύσκολο να ξεφύγει κάποια! Επίσης είναι αρκετά εύκολο να ορίσεις και δικές σου function ώστε να υλοποιηθούν συγκεκριμένες διεργασίες με μεγαλύτερη διαφάνεια και κατανόηση από το χρήστη. Δυστυχώς είναι συχνά στρυφνό, και ενίοτε αργό, αλλά given time and patience κάνει παπάδες. Επίσης ΜΕΡΙΚΟΙ θεωρούν ότι κάνει και ωραία γραφήματα.Έχουν βγει κάποια gui τα οποία όμως από πολλούς θεωρούνται ανεπαρκή (εως απαράδεκτα) και ως αποτέλεσμα η σοβαρή δουλειά γίνεται σε κονσόλα. Αξιοσημείωτη είναι η κοινότητα του, που παρέχει πολλές και εξειδικευμένες συμβουλές.
(1i. Bioconductor. Τιμής ένεκεν αναφορά. "Αdd-on" κτηνώδες και απίστευτα εξειδικευμένο πακέτα για αναλύσεις βιολογικών δεδομένων μέσω R. Στα Βioinformatics παίζει μόνο του. Ότι καλύτερο, όχι για τους μη μυημένους αλλά αν θέλεις να αναλύσεις κάτι... κάντο σωστά...)
website: R -> http://www.r-project.org/ , Bioconductor -> http://www.bioconductor.org/
license: R -> GNU General Public License Version 2 , Bioconductor -> Artistic License 2.0



2. Gretl. (ή Gnu Regression, Econometrics and Time-series Library και με σήμα το κοριτσάκι!) Απίθανο. Εύχρηστο, γρήγορο, και με gui που δουλεύει άψογα το πνευματικό παιδάκι του Allin Cottrell είναι εξαιρετικό για οικονομετρικές αναλύσεις. Χωλαίνει μερικώς στα cross-sectional data αλλά ακόμα και τότε εντυπωσιάζει με την ταχύτητα και την σταθερότητα του. Α! To Gretl όντως έχει ωραία γραφήματα τα οποία παράγει κατόπιν άψογης συνεργασίας με το gnuplot. (Δεν χρειάζεται να γράψετε ποτέ γραμμή στο gnuplot οι ίδιοι εκτός και αν το θελήσετε για αποσταθεροποιήσετε το γράφημα περαιτέρω) Επίσης με ενεργή κοινότητα (κυρίως με mail-listings που είναι άπειρα) άρα πολλές ερωτήσεις απαντιούνται. Από προγραμματιστικής άποψης : C και GTK στα καλύτερα τους! Very Happy Μεγάλο του ατού είναι ότι χάρη στην εξαιρετική δομή του και το καλό interface πολλά tutorial και για άλλα προγράμματα μπορούν να υλοποιηθούν στο GretL άνετα.
website: Gretl -> http://gretl.sourceforge.net
license: Gretl -> GNU General Public License Version 3



3. Gnumeric. Αν και ξεκίνησε ως spreadsheet ως αντίπαλος του excel πήρε έναν πιο "τεχνικό" δρόμο με κάποιες προσπάθειες για να αποκτήσει κάποιες λίγο πιο εξειδικευμένες λειτουργίες. Εύχρηστο, όχι κάτι απίστευτο αλλά αν θες να δεις ένα trend στα γρήγορα ή να κάνεις plotάκι, it can be fun. Μερικές φορές επιφανειακό και εφετζίδικο δένοντας τον χρήστη με κάποιες επιλογές του. Το όλο project άρχισε από τον Miguel de Icaza. Γίνονται προσπάθειες με συνεργασία με την κοινότητα του R για να βελτιωθεί η ακρίβεια του όλου project αλλά δεν ξέρω κατά πόσο ευδοκιμούν (και σε τι αποσκοπούν)....
website: Gnumeric -> http://gnome.org/projects/gnumeric/
license: Gnumeric -> GNU General Public License Version 2



4. SciPy/matplotlib. Όπως λέει και το site "SciPy (pronounced "Sigh Pie") is open-source software for mathematics, science, and engineering." Γιατί SciPy και όχι κάτι άλλο? Γιατί πολύ απλα η Python είναι ΠΟΛΥ ΑΠΛΗ. Εγώ μονάχα C/C++ έγραφα άντε και λίγο PHP και η Python μου βγήκε πανεύκολη. Δοκιμάστε την. Θα εκπλαγείτε που με λίγη προσοχή θα υλοποιήσετε εξειδικευμένα script για γρήγορες αναλύσεις μεγάλης κλίμακας άνετα. Επίσης τα γραφήματα μέσω της matplotlib είναι όμορφα, διακριτικά και ΚΑΛΥΤΕΡΑ από της R.... Προσοχή όμως γιατί ειδικά το matplotlib διαχειρίζεται τα μηδενικά κάπως "περίεργα" και μερικές φορές τα γραφήματα βγαίνουν θεότρελα (και προφανώς λάθος). Έχουν βγει κάποια interfaces RPy, RSPython, etc. για να γίνεται linked η R με την Python. Όποιος γενναίος να μοιραστεί τις εντυπώσεις του μαζί μας Smile (προσωπικά θεωρώ κάλύτερα να γίνονται export σε .csv τα δεδομένα και από εκεί τα διαχειρίζονται μέσω R ή Python πάλι για περαιτέρω ανάλυση γιατί υπάρχει καλύτερη διαφάνεια στις διεργασίες).
website: SciPy -> http://www.scipy.org , matplotlib -> http://matplotlib.sourceforge.net/
license: SciPy -> BSD(-like) license , matplotlib -> PSF-like license.



5. Rlplot. Γιατί ωραία τα δεδομένα μας αλλά πώς τα παρουσιάσουμε? Rlplot του πανεπιστημίου του Innbruck. Γρήγορο σχετικά, crisp και απλό. Όχι κάτι εξειδικευμένο απίστευτα αλλά βολεύει. Powered by Trolltech's QT... Έχει μερικά πολύ ωραία και εξειδικευμένα γραφήματα ειδικά για 3D plots αλλά πρέπει να παραδεχτώ ότι είναι αργό και ασταθές όταν τα δεδομένα μας γίνονται πολλά. (πχ. Ενώ το 1500 samples γίνονται plot σε 2 seconds , τα 3000 επίσης σε κάπου τόσο, τα 32035 απλά κολλάνε το πρόγραμμα Very Happy )
website: Rlplot -> http://rlplot.sourceforge.net/
license: Rlplot -> GNU General Public License Version 3



6. Fityk. Δείχνει εντυπωσιακό. Μερικές από τις λειτουργίες πραγματικά πιστεύω ότι δεν υπάρχουν σε άλλο πρόγραμμα με τόσο καλό και κατατοπιστικό GUI. Δεν το χρειάστηκα ποτέ βέβαια για κάτι "βαρύ" και δεν το χρησιμοποίησα ποτέ σοβαρά εκτός από παιχνιδάκια fitting. Πολύ καλή δουλειά αλλά όπως και το Bioconductor πολύ specialized. C++ με Python bindings για εσάς.
website: Fityk -> http://www.unipress.waw.pl/fityk/
license: Fityk -> GNU General Public License Version 2



7. JMulTi. To αντίπαλο δέος του Gretl. Από το Πανεπιστήμιο Humboldt του Βερολίνου (όχι το Freien). Σοβαρό πρόγραμμα. Κάνει ότι και το Gretl και ίσως μερικές φορές και καλύτερα (κατά κάποιους) και με περισσότερες επιλογές (αυτό το κρίνω και εγώ). Δεν μου φάνηκε και τόσο εύχρηστο το GUI του είναι μάλλον "υπερφορτωμένο" στην προσπάθεια τους να μην κρύψουν καμία λειτουργία. Aν το Gretl δε σας κάνει κλικ τότε δοκιμάστε το JMulTi. Εξολοκλήρου γραμμένο σε Java. (Το screen-shot δεν είναι δικό μου αλλά από την wikipedia)
website: JMulTi -> http://www.jmulti.de/
license: JMulTi -> GNU General Public License Version 2


Όποιος θέλει βοήθεια με R ή Gretl ή SciPy ή γενικά με τη στατιστική του ανάλυση, λέει. Ίσως μπορούμε να αλληλοβοηθηθούμε.
Καλό βιβλίο για αρχή στο R : Peter Dalgaard (μορφή) - Introductory Statistics with R. (Standard Ανάγνωσμα) (Cult κατάσταση όταν έχεις απορία στο R, γράφεις στην mailing list και σου απαντάει ο ίδιος.)

Πηγή : Statistical Programming +Linux


Έχει επεξεργασθεί από τον/την paterask στις Τετ 9 Δεκ 2009 - 11:30, 1 φορά
avatar
paterask

Posts : 356
Join date : 17/10/2009
Location : Utrecht, The Netherlands

http://goo.gl/5S6Hpv

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από grstats Την / Το Τετ 9 Δεκ 2009 - 9:22

Fobero review. Kaneis gia dhmosiografos se computeristiko periodiko kwsta... Egw thlew kai alla tetoia an exeis ... Kai thelw na mou peis apo konta gia thn python!!!
avatar
grstats

Posts : 740
Join date : 21/10/2009

http://stat-athens.aueb.gr/~grstats/

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από paterask Την / Το Τετ 9 Δεκ 2009 - 11:33

Η αλήθεια να λέγεται, το αρθράκι το τσίμπησα από το κεντρικό forum των ubuntu. Ήταν όμως τόσο σχετικό με εμάς που δεν αντιστάθηκα να το πάρω και να το τοποθετήσω εδώ. Λίγα πράγματα έχω αλλάξει. Το παιδί που γράφει εκεί έχει τρομερή αίσθηση των πραγμάτων και μ'έχει βοηθήσει αρκετά μέσω μηνυμάτων.
avatar
paterask

Posts : 356
Join date : 17/10/2009
Location : Utrecht, The Netherlands

http://goo.gl/5S6Hpv

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από thodoris Την / Το Τετ 25 Αυγ 2010 - 17:41

Γεια σας!!! Με λενε Θοδωρή και είμαι φοιτητής στο τμήμα Στατιστικής του ΟΠΑ.
Πήρα επιτέλους την απόφαση να αλλάξω σε Linux μετά απο τόσα χρόνια me Windows αλλα έχω κάποιες απορίες και αν μπορείτε να με βοηθήσετε...
Τα χρησιμοποιεί κανείς απο εδώ και αν ναι βολεύουν?
Με τα στατιστικά προγράμματα τι γίνεται? Εκτός απο την R που τρέχει, τα υπόλοιπα SPSS, Minitab κλπ?
Τέλος το Office της Microsoft τρέχει ή υπάρχει κάποιο αντίστοιχο με Word, Powerpoint κλπ?

thodoris

Posts : 7
Join date : 23/12/2009

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από paterask Την / Το Τετ 25 Αυγ 2010 - 18:07

Γεια σου Θοδωρή, πρώτα θα σου πρότεινα να δημιουργήσεις ένα dual boot μηχάνημα και με τα δύο λειτουργικά πάνω γιατί αλλιώς υπάρχει μεγάλη περίπτωση να τα τσαντιστείς στην αρχή. Βολεύει γιατί μερικά προγραμμάτα δουλεύουν ακόμα καλύτερα στα windows μιας και είναι ακόμα περισσότερο εμπορικά.

Εκτός από τα προγραμμάτα που αναφέρω πιο πάνω δε μου φαίνεται να υπάρχουν ειδικές εκδόσεις των υπολοίπων για linux εκτός από το Στάτα αν θυμάμαι καλά.
Όσο για το office υπάρχει το open office το οποίο είναι δωρεάν ανεπτυγμένη από την oracle και κάνει ακριβώς την ίδια δουλειά και είναι δωρεάν και έχει πλήρη συμβατότητα με το office της Microsoft.
Μεγάλο ελάττωμα των linux είναι ότι δεν έχω βρει κάποιον editor όπως τον winedit που υπάρχει στα windows. Αν έχει κανείς κάποια ιδέα ας την ρίξει.. Ότι άλλο χρειαστείς ρώτησε. Καλή αρχή στα linux!
avatar
paterask

Posts : 356
Join date : 17/10/2009
Location : Utrecht, The Netherlands

http://goo.gl/5S6Hpv

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από R4ever Την / Το Τετ 25 Αυγ 2010 - 21:23

Enas poly kalos editor einai o Emacs, pou douleuei kai me R kai alla stat software, kai nomizo mporei na to doulepseis kai me LaTex -- gia perissoteres plirofories: Emacs Speak Statistics
avatar
R4ever

Posts : 44
Join date : 20/01/2010
Age : 39

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από thodoris Την / Το Πεμ 26 Αυγ 2010 - 15:42

Ευχαριστώ για την απάντηση. Θα δοκιμάσω και με τα δυο λειτουργικά για αρχή. Έχω διαβάσει διάφορους οδηγούς για το πως θα το εγκαταστήσω και να κάνω partition τον δίσκο αλλά αυτό που δεν κατάλαβα είναι όταν εγκαταστήσω τα Linux θα υπάρχουν σε αυτά τα αρχεία των windows ή θα είναι άδεια και θα πρέπει να περάσω όλα τα προγράμματα από την αρχή?

thodoris

Posts : 7
Join date : 23/12/2009

Επιστροφή στην κορυφή Πήγαινε κάτω

Απ: Statistical Programming + Linux

Δημοσίευση από paterask Την / Το Πεμ 26 Αυγ 2010 - 18:00

thodoris έγραψε:Ευχαριστώ για την απάντηση. Θα δοκιμάσω και με τα δυο λειτουργικά για αρχή. Έχω διαβάσει διάφορους οδηγούς για το πως θα το εγκαταστήσω και να κάνω partition τον δίσκο αλλά αυτό που δεν κατάλαβα είναι όταν εγκαταστήσω τα Linux θα υπάρχουν σε αυτά τα αρχεία των windows ή θα είναι άδεια και θα πρέπει να περάσω όλα τα προγράμματα από την αρχή?

Όχι καταλαμβάνουν διαφορετικό χώρο το ένα από το άλλο. Τα αρχεία(βίντεο,τραγούδια,έγγραφα κτλ) που έχεις στα windows θα μπορείς να τα περάσεις στα ubuntu αλλά τα προγράμματα που είναι γραμμένα προφανώς όχι. Λογικό εφόσον η εγγραφή γίνεται στο κάθε λειτουργικό ξεχωριστά και το καθένα έχει διαφορετικό τρόπο με τον οποίο τα χειρίζεται.
Πλέον η εγκατάσταση και των δύο παράλληλα έχει γίνει εύκολη υπόθεση.. Παλιότερα ήταν κομματάκι δύσκολη η εγκατάσταση των linux. Τώρα απλά αποφασίζεις πόσο χώρο θα πιάσουν και αρχίζει αυτόματα η διαδικασία (πάλι μπορείς να κάνεις ειδικές ρυθμίσεις αλλά καλό θα ήταν να μη τις πειράξεις αν δε ξέρεις)
Όλα τα προγραμμάτα για τα ubuntu τα βρίσκεις μέσα στο λειτουργικό μέσω του synaptic manager που διαθετει και τα κατεβάζεις από το ίντερνετ. Ψάξε και στο φόρουμ των ubuntu το ελληνικό είναι μεγάλη η κοινότητα και βοηθάνε πολύ τα παιδιά - ubuntu greek forum - . Κιπ απ!
avatar
paterask

Posts : 356
Join date : 17/10/2009
Location : Utrecht, The Netherlands

http://goo.gl/5S6Hpv

Επιστροφή στην κορυφή Πήγαινε κάτω

Επιστροφή στην κορυφή


 
Δικαιώματα σας στην κατηγορία αυτή
Δεν μπορείτε να απαντήσετε στα Θέματα αυτής της Δ.Συζήτησης