.
Στην μηχανική μάθηση, οι μηχανές Διανυσμάτων Υποστήριξης (SVM, επίσης δίκτυα Διανυσμάτων Υποστήριξης[1]) είναι εποπτευόμενα μοντέλα εκμάθησης με σχετικούς αλγόριθμους μάθησης που αναλύουν δεδομένα για ανάλυση ταξινόμησης και παλινδρόμησης. Αναπτύχθηκε στα εργαστήρια AT&T Bell από τον Vladimir Vapnik με συναδέλφους (Boser et al., 1992, Guyon et al., 1993, Cortes and Vapnik, 1995, [1] Vapnik et al., 1997 Τα SVM είναι ένα από τις πιο ισχυρές μέθοδοι πρόβλεψης, που βασίζονται σε στατιστικά πλαίσια μάθησης ή τη θεωρία VC που προτάθηκαν από τους Vapnik (1982, 1995) και Chervonenkis (1974). Λαμβάνοντας υπόψη ένα σύνολο παραδειγμάτων εκπαίδευσης, το καθένα επισημαίνεται ότι ανήκει σε μία από τις δύο κατηγορίες, ένας αλγόριθμος εκπαίδευσης SVM δημιουργεί ένα μοντέλο που εκχωρεί νέα παραδείγματα στη μία ή στην άλλη κατηγορία, καθιστώντας το έναν μη πιθανολογικό δυαδικό γραμμικό ταξινομητή (αν και μέθοδοι όπως η κλιμάκωση Platt υπάρχουνε για τη χρήση του SVM σε μια πιθανολογική ρύθμιση ταξινόμησης). Το SVM αντιστοιχίζει παραδείγματα εκπαίδευσης σε σημεία στο χώρο, ώστε να μεγιστοποιήσει το πλάτος του χάσματος μεταξύ των δύο κατηγοριών. Στη συνέχεια, τα νέα παραδείγματα χαρτογραφούνται στον ίδιο χώρο και προβλέπεται ότι ανήκουν σε μια κατηγορία με βάση την πλευρά του χάσματος είναι.
Εκτός από την εκτέλεση γραμμικής ταξινόμησης, τα SVM μπορούν να εκτελέσουν αποτελεσματικά μια μη γραμμική ταξινόμηση χρησιμοποιώντας αυτό που ονομάζεται κόλπο του πυρήνα, χαρτογραφώντας σιωπηρά τις εισόδους τους σε χώρους χαρακτηριστικών υψηλών διαστάσεων.
Ο αλγόριθμος ομαδοποίησης διανυσμάτων υποστήριξης[2], που δημιουργήθηκε από τους Hava Siegelmann και Vladimir Vapnik, εφαρμόζει τα στατιστικά στοιχεία των διανυσμάτων υποστήριξης, που αναπτύχθηκαν στον αλγόριθμο μηχανών διανυσμάτων υποστήριξης, για την κατηγοριοποίηση δεδομένων χωρίς ετικέτα. Αυτά τα σύνολα δεδομένων απαιτούν προσεγγίσεις μάθησης χωρίς επίβλεψη, οι οποίες προσπαθούν να παράγουν μια φυσική ομαδοποίηση των δεδομένων σε ομάδες και, στη συνέχεια, να απεικονείσουν νέα δεδομένα σύμφωνα με αυτές τις συστάδες.
Το σημείο εκκίνησης για την κατασκευή μιας μηχανής διανυσμάτων υποστήριξης είναι ένα σύνολο αντικειμένων εκπαίδευσης για τα οποία είναι γνωστό σε ποια κατηγορία ανήκουν. Κάθε αντικείμενο αντιπροσωπεύεται από ένα διάνυσμα σε ένα διανυσματικό χώρο. Είναι καθήκον της μηχανής διανυσμάτων υποστήριξης να προσαρμόσει ένα υπερεπίπεδο σε αυτόν τον χώρο, το οποίο λειτουργεί ως διαχωριστική επιφάνεια και χωρίζει τα εκπαιδευτικά αντικείμενα σε δύο κατηγορίες. Η απόσταση μεταξύ εκείνων των διανυσμάτων που είναι πιο κοντά στο υπερεπίπεδο μεγιστοποιείται. Αυτό το ευρύ, κενό περίγραμμα θα πρέπει αργότερα να διασφαλίσει ότι τα αντικείμενα που δεν αντιστοιχούν ακριβώς στα αντικείμενα εκπαίδευσης ταξινομούνται όσο το δυνατόν πιο αξιόπιστα.
Κατά την εισαγωγή του υπερεπίπεδου, δεν είναι απαραίτητο να ληφθούν υπόψη όλα τα διανύσματα εκπαίδευσης. Τα διανύσματα που βρίσκονται πιο μακριά από το υπερεπίπεδο και είναι, θα λέγαμε, «κρυμμένα» πίσω από ένα μέτωπο άλλων διανυσμάτων δεν επηρεάζουν τη θέση και τη θέση του διαχωριστικού επιπέδου. Το υπερεπίπεδο εξαρτάται μόνο από τα διανύσματα που βρίσκονται πλησιέστερα σε αυτό - και μόνο αυτά χρειάζονται για να περιγράψουν το επίπεδο μαθηματικά ακριβώς. Αυτά τα πλησιέστερα διανύσματα ονομάζονται διανύσματα υποστήριξης και έτσι πήραν το όνομά τους οι μηχανές διανυσμάτων υποστήριξης.
Ένα υπερεπίπεδο δεν μπορεί να "λυγίσει", επομένως ένας καθαρός διαχωρισμός με ένα υπερεπίπεδο είναι δυνατός μόνο εάν τα αντικείμενα είναι γραμμικά διαχωρίσιμα. Γενικά, αυτή η προϋπόθεση δεν πληρούται για πραγματικά σύνολα αντικειμένων εκπαίδευσης. Στην περίπτωση μη γραμμικά διαχωρισμένων δεδομένων, οι μηχανές διανυσμάτων υποστήριξης χρησιμοποιούν το κόλπο του πυρήνα για να επιβάλλουν ένα μη γραμμικό όριο κλάσης.
Η ιδέα πίσω από το κόλπο του πυρήνα είναι να μεταφερθεί ο διανυσματικός χώρος και επομένως και τα διανύσματα εκπαίδευσης που περιέχονται σε αυτόν σε έναν χώρο υψηλότερης διάστασης. Σε ένα χώρο με επαρκώς μεγάλο αριθμό διαστάσεων - σε περίπτωση αμφιβολίας άπειρες - ακόμη και το πιο ένθετο διανυσματικό σύνολο γίνεται γραμμικά διαχωρίσιμο. Το διαχωριστικό υπερεπίπεδο προσδιορίζεται τώρα σε αυτόν τον χώρο υψηλότερων διαστάσεων. Όταν μετασχηματίζεται ξανά στον χώρο χαμηλότερης διάστασης, το γραμμικό υπερεπίπεδο γίνεται μια μη γραμμική, πιθανώς ακόμη και μη συνδεδεμένη, υπερεπιφάνεια που χωρίζει τα διανύσματα εκπαίδευσης σε δύο κατηγορίες.
Hellenica World - Scientific Library
Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License