ART

 

.

Ένας αυτοοργανωμένος χάρτης (SOM) ή ένας αυτο-οργανωμένος χάρτης χαρακτηριστικών (SOFM) είναι μια τεχνική μηχανικής εκμάθησης χωρίς επίβλεψη που χρησιμοποιείται για την παραγωγή μιας χαμηλών διαστάσεων (συνήθως δισδιάστατης) αναπαράστασης ενός συνόλου δεδομένων υψηλότερης διάστασης, διατηρώντας παράλληλα την τοπολογική δομή των δεδομέμων. Για παράδειγμα, ένα σύνολο δεδομένων με μεταβλητές p που μετρώνται σε n παρατηρήσεις θα μπορούσε να αναπαρασταθεί ως ομάδες παρατηρήσεων με παρόμοιες τιμές για τις μεταβλητές. Αυτά τα συμπλέγματα θα μπορούσαν στη συνέχεια να οπτικοποιηθούν ως ένας δισδιάστατος "χάρτης" έτσι ώστε οι παρατηρήσεις σε εγγύς συστάδες να έχουν περισσότερες παρόμοιες τιμές από τις παρατηρήσεις σε απομακρυσμένα συμπλέγματα. Αυτό μπορεί να διευκολύνει την οπτικοποίηση και την ανάλυση δεδομένων υψηλών διαστάσεων.

Ένα SOM είναι ένας τύπος τεχνητού νευρωνικού δικτύου, αλλά εκπαιδεύεται χρησιμοποιώντας ανταγωνιστική μάθηση αντί για μάθηση διόρθωσης σφαλμάτων (π.χ. backpropagation με gradient descent) που χρησιμοποιείται από άλλα τεχνητά νευρωνικά δίκτυα. Το SOM εισήχθη από τον Φινλανδό καθηγητή Teuvo Kohonen τη δεκαετία του 1980 και επομένως μερικές φορές ονομάζεται χάρτης Kohonen ή δίκτυο Kohonen.[1][2] Ο χάρτης ή το δίκτυο Kohonen είναι ένα υπολογιστικά βολικό οικοδόμημα αφαίρεσης σε βιολογικά μοντέλα νευρικών συστημάτων από τη δεκαετία του 1970[3] και μοντέλα μορφογένεσης που χρονολογούνται από τον Άλαν Τούρινγκ στη δεκαετία του 1950.[4]

Οι αυτοοργανωμένοι χάρτες, όπως τα περισσότερα τεχνητά νευρωνικά δίκτυα, λειτουργούν με δύο τρόπους: εκπαίδευση και χαρτογράφηση. Πρώτον, η εκπαίδευση χρησιμοποιεί ένα σύνολο δεδομένων εισόδου (ο "χώρος εισόδου") για να δημιουργήσει μια αναπαράσταση χαμηλότερων διαστάσεων των δεδομένων εισόδου (ο "χώρος χάρτη"). Δεύτερον, η χαρτογράφηση ταξινομεί πρόσθετα δεδομένα εισόδου χρησιμοποιώντας τον παραγόμενο χάρτη.

Στις περισσότερες περιπτώσεις, ο στόχος της εκπαίδευσης είναι να αναπαραστήσει έναν χώρο εισόδου με διαστάσεις p ως χώρο χάρτη με δύο διαστάσεις. Συγκεκριμένα, ένας χώρος εισόδου με μεταβλητές p λέγεται ότι έχει διαστάσεις p. Ένας χώρος χάρτη αποτελείται από στοιχεία που ονομάζονται «κόμβοι» ή «νευρώνες», τα οποία είναι διατεταγμένα ως εξαγωνικό ή ορθογώνιο πλέγμα με δύο διαστάσεις.[5] Ο αριθμός των κόμβων και η διάταξή τους καθορίζονται εκ των προτέρων με βάση τους μεγαλύτερους στόχους της ανάλυσης και της εξερεύνησης των δεδομένων.

Κάθε κόμβος στο χώρο του χάρτη σχετίζεται με ένα διάνυσμα «βάρους», το οποίο είναι η θέση του κόμβου στο χώρο εισόδου. Ενώ οι κόμβοι στο χώρο του χάρτη παραμένουν σταθεροί, η εκπαίδευση συνίσταται στη μετακίνηση των διανυσμάτων βάρους προς τα δεδομένα εισόδου (μειώνοντας μια μέτρηση απόστασης όπως η Ευκλείδεια απόσταση) χωρίς να αλλοιωθεί η τοπολογία που προκαλείται από το χώρο του χάρτη. Μετά την εκπαίδευση, ο χάρτης μπορεί να χρησιμοποιηθεί για την ταξινόμηση πρόσθετων παρατηρήσεων για τον χώρο εισόδου, βρίσκοντας τον κόμβο με το πλησιέστερο διάνυσμα βάρους (μετρική μικρότερης απόστασης) στο διάνυσμα χώρου εισόδου.

Ο στόχος της μάθησης στον SOM είναι να προκαλέσει διαφορετικά μέρη του δικτύου να ανταποκρίνονται παρόμοια σε ορισμένα πρότυπα εισόδου. Αυτό οφείλεται εν μέρει στον τρόπο με τον οποίο χειρίζονται οπτικές, ακουστικές ή άλλες αισθητηριακές πληροφορίες σε ξεχωριστά μέρη του εγκεφαλικού φλοιού στον ανθρώπινο εγκέφαλο.[6]

Τα βάρη των νευρώνων αρχικοποιούνται είτε σε μικρές τυχαίες τιμές είτε δειγματοληπτικά ομοιόμορφα από τον υποχώρο που εκτείνεται από τα δύο μεγαλύτερα ιδιοδιανύσματα κύριας συνιστώσας. Με την τελευταία εναλλακτική, η εκμάθηση είναι πολύ πιο γρήγορη επειδή τα αρχικά βάρη δίνουν ήδη μια καλή προσέγγιση των βαρών SOM.[7]

Το δίκτυο πρέπει να τροφοδοτείται με μεγάλο αριθμό παραδειγμάτων διανυσμάτων που αντιπροσωπεύουν, όσο το δυνατόν πλησιέστερα, τα είδη των διανυσμάτων που αναμένονται κατά τη χαρτογράφηση. Τα παραδείγματα συνήθως χορηγούνται πολλές φορές ως επαναλήψεις.

Η εκπαίδευση χρησιμοποιεί ανταγωνιστική μάθηση. Όταν ένα παράδειγμα εκπαίδευσης τροφοδοτείται στο δίκτυο, υπολογίζεται η Ευκλείδεια απόστασή του σε όλα τα διανύσματα βάρους. Ο νευρώνας του οποίου το διάνυσμα βάρους είναι περισσότερο παρόμοιο με την είσοδο ονομάζεται μονάδα καλύτερης αντιστοίχισης (BMU). Τα βάρη του BMU και των νευρώνων κοντά σε αυτό στο πλέγμα SOM προσαρμόζονται προς το διάνυσμα εισόδου. Το μέγεθος της αλλαγής μειώνεται με το χρόνο και με την απόσταση του πλέγματος από το BMU.

Εγκυκλοπαίδεια Πληροφορικής

Κόσμος

Αλφαβητικός κατάλογος

Hellenica World - Scientific Library

Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License