.
Το Waikato Environment for Knowledge Analysis (Weka), που αναπτύχθηκε στο Πανεπιστήμιο του Waikato, Νέα Ζηλανδία, είναι δωρεάν λογισμικό με άδεια χρήσης GNU General Public License, και το λογισμικό συνοδευτικό του βιβλίου "Data Mining: Practical Machine Learning Tools and Techniques".[ 1]
Περιγραφή
Το Weka περιέχει μια συλλογή εργαλείων οπτικοποίησης και αλγορίθμων για ανάλυση δεδομένων και μοντελοποίηση πρόβλεψης, μαζί με γραφικές διεπαφές χρήστη για εύκολη πρόσβαση σε αυτές τις λειτουργίες.[1] Η αρχική έκδοση του Weka που δεν ήταν Java ήταν μια πρόσοψη Tcl/Tk σε αλγόριθμους μοντελοποίησης (κυρίως τρίτων) που εφαρμόστηκαν σε άλλες γλώσσες προγραμματισμού, συν βοηθητικά προγράμματα προεπεξεργασίας δεδομένων σε C και ένα σύστημα βασισμένο σε makefile για την εκτέλεση πειραμάτων μηχανικής εκμάθησης. Αυτή η αρχική έκδοση σχεδιάστηκε κυρίως ως εργαλείο για την ανάλυση δεδομένων από γεωργικούς τομείς,[2][3] αλλά η πιο πρόσφατη πλήρως βασισμένη σε Java έκδοση (Weka 3), για την οποία η ανάπτυξη ξεκίνησε το 1997, χρησιμοποιείται τώρα σε πολλές διαφορετικές εφαρμογές τομείς, ιδίως για εκπαιδευτικούς σκοπούς και έρευνα. Τα πλεονεκτήματα του Weka περιλαμβάνουν:
Δωρεάν διαθεσιμότητα υπό τη Γενική Δημόσια Άδεια GNU.
Φορητότητα, αφού υλοποιείται πλήρως στη γλώσσα προγραμματισμού Java και έτσι τρέχει σχεδόν σε οποιαδήποτε σύγχρονη υπολογιστική πλατφόρμα.
Μια ολοκληρωμένη συλλογή τεχνικών προεπεξεργασίας και μοντελοποίησης δεδομένων.
Ευκολία στη χρήση λόγω των γραφικών διεπαφών χρήστη.
Το Weka υποστηρίζει πολλές τυπικές εργασίες εξόρυξης δεδομένων, πιο συγκεκριμένα, προεπεξεργασία δεδομένων, ομαδοποίηση, ταξινόμηση, παλινδρόμηση, οπτικοποίηση και επιλογή χαρακτηριστικών. Η είσοδος στο Weka αναμένεται να μορφοποιηθεί σύμφωνα με τη Μορφή Αρχείου Χαρακτηριστικών Σχέσεων και με το όνομα αρχείου να φέρει την επέκταση .arff. Όλες οι τεχνικές του Weka βασίζονται στην υπόθεση ότι τα δεδομένα είναι διαθέσιμα ως ένα επίπεδο αρχείο ή σχέση, όπου κάθε σημείο δεδομένων περιγράφεται από έναν σταθερό αριθμό χαρακτηριστικών (συνήθως, αριθμητικά ή ονομαστικά χαρακτηριστικά, αλλά υποστηρίζονται και κάποιοι άλλοι τύποι χαρακτηριστικών) . Το Weka παρέχει πρόσβαση σε βάσεις δεδομένων SQL χρησιμοποιώντας τη Συνδεσιμότητα βάσεων δεδομένων Java και μπορεί να επεξεργαστεί το αποτέλεσμα που επιστρέφεται από ένα ερώτημα βάσης δεδομένων. Το Weka παρέχει πρόσβαση στη βαθιά μάθηση με το Deeplearning4j.[4] Δεν είναι ικανό για εξόρυξη δεδομένων πολλαπλών σχέσεων, αλλά υπάρχει ξεχωριστό λογισμικό για τη μετατροπή μιας συλλογής συνδεδεμένων πινάκων βάσεων δεδομένων σε έναν ενιαίο πίνακα που είναι κατάλληλος για επεξεργασία με χρήση του Weka.[5] Ένας άλλος σημαντικός τομέας που επί του παρόντος δεν καλύπτεται από τους αλγόριθμους που περιλαμβάνονται στη διανομή Weka είναι η μοντελοποίηση ακολουθιών.
Πακέτα επέκτασης
Στην έκδοση 3.7.2, προστέθηκε ένας διαχειριστής πακέτων για να επιτρέψει την ευκολότερη εγκατάσταση πακέτων επέκτασης.[6] Ορισμένες λειτουργίες που περιλαμβάνονταν στο Weka πριν από αυτήν την έκδοση έχουν μεταφερθεί από τότε σε τέτοια πακέτα επεκτάσεων, αλλά αυτή η αλλαγή διευκολύνει επίσης άλλους να συνεισφέρουν επεκτάσεις στο Weka και να διατηρήσουν το λογισμικό, καθώς αυτή η αρθρωτή αρχιτεκτονική επιτρέπει ανεξάρτητες ενημερώσεις του τον πυρήνα Weka και τις μεμονωμένες επεκτάσεις.
Ιστορία
Το 1993, το Πανεπιστήμιο του Waikato στη Νέα Ζηλανδία ξεκίνησε την ανάπτυξη της αρχικής έκδοσης του Weka, η οποία έγινε ένας συνδυασμός Tcl/Tk, C και makefiles.
Το 1997, ελήφθη η απόφαση για την εκ νέου ανάπτυξη του Weka από την αρχή στην Java, συμπεριλαμβανομένων των υλοποιήσεων αλγορίθμων μοντελοποίησης.[7]
Το 2005, ο Weka έλαβε το βραβείο SIGKDD Data Mining and Knowledge Discovery Service Award.[8][9]
Το 2006, η Pentaho Corporation απέκτησε αποκλειστική άδεια χρήσης του Weka για επιχειρηματική ευφυΐα.[10] Αποτελεί το στοιχείο εξόρυξης δεδομένων και προγνωστικής ανάλυσης της σουίτας επιχειρηματικής ευφυΐας Pentaho. Το Pentaho αποκτήθηκε από τότε από την Hitachi Vantara και η Weka υποστηρίζει τώρα το στοιχείο ανοιχτού κώδικα PMI (Plugin for Machine Intelligence).[11]
Σχετικά εργαλεία
Το Auto-WEKA είναι ένα αυτοματοποιημένο σύστημα μηχανικής εκμάθησης για το Weka.[12]
Το Environment for DeveLoping KDD-Applications Supported by Index-Structures (ELKI) είναι ένα παρόμοιο έργο με το Weka με εστίαση στην ανάλυση cluster, δηλαδή σε μεθόδους χωρίς επίβλεψη.
Το H2O.ai είναι μια πλατφόρμα επιστήμης δεδομένων και μηχανικής μάθησης ανοιχτού κώδικα
Το KNIME είναι ένα λογισμικό μηχανικής εκμάθησης και εξόρυξης δεδομένων που υλοποιείται σε Java.
Το Massive Online Analysis (MOA) είναι ένα έργο ανοιχτού κώδικα για μεγάλης κλίμακας εξόρυξη ροών δεδομένων, που αναπτύχθηκε επίσης στο Πανεπιστήμιο του Waikato στη Νέα Ζηλανδία.
Το Neural Designer είναι ένα λογισμικό εξόρυξης δεδομένων που βασίζεται σε τεχνικές βαθιάς μάθησης γραμμένες σε C++.
Το Orange είναι ένα παρόμοιο έργο ανοιχτού κώδικα για εξόρυξη δεδομένων, μηχανική μάθηση και οπτικοποίηση που βασίζεται στο scikit-learn.
Το RapidMiner είναι ένα εμπορικό πλαίσιο μηχανικής μάθησης που υλοποιείται σε Java το οποίο ενσωματώνει το Weka.
Το scikit-learn είναι μια δημοφιλής βιβλιοθήκη μηχανικής εκμάθησης στην Python.
Hellenica World - Scientific Library
Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License