.
Η εξαγωγή γνώσης είναι η δημιουργία γνώσης από δομημένες (σχεσιακές βάσεις δεδομένων, XML) και μη δομημένες (κείμενο, έγγραφα, εικόνες) πηγές. Η γνώση που προκύπτει πρέπει να είναι σε αναγνώσιμη και μηχανικά ερμηνεύσιμη μορφή και πρέπει να αντιπροσωπεύει τη γνώση με τρόπο που να διευκολύνει την εξαγωγή συμπερασμάτων. Αν και είναι μεθοδικά παρόμοια με την εξαγωγή πληροφοριών (NLP) και το ETL (αποθήκη δεδομένων), το κύριο κριτήριο είναι ότι το αποτέλεσμα εξαγωγής υπερβαίνει τη δημιουργία δομημένης πληροφορίας ή τη μετατροπή σε σχεσιακό σχήμα. Απαιτεί είτε την επαναχρησιμοποίηση της υπάρχουσας επίσημης γνώσης (επαναχρησιμοποίηση αναγνωριστικών ή οντολογιών) είτε τη δημιουργία ενός σχήματος με βάση τα δεδομένα προέλευσης.
Η ομάδα RDB2RDF W3C τυποποιεί αυτήν τη στιγμή μια γλώσσα για την εξαγωγή πλαισίων περιγραφής πόρων (RDF) από σχεσιακές βάσεις δεδομένων. Ένα άλλο δημοφιλές παράδειγμα εξαγωγής γνώσης είναι ο μετασχηματισμός της Wikipedia σε δομημένα δεδομένα και επίσης η αντιστοίχιση στην υπάρχουσα γνώση (βλ. DBpedia και Freebase).
ΣΦΑΙΡΙΚΗ ΕΙΚΟΝΑ
Μετά την τυποποίηση των γλωσσών αναπαράστασης γνώσης όπως η RDF και η OWL, έχει διεξαχθεί μεγάλη έρευνα στην περιοχή, ειδικά όσον αφορά τη μετατροπή των σχεσιακών βάσεων δεδομένων σε RDF, την ανάλυση ταυτότητας, την ανακάλυψη γνώσης και την εκμάθηση οντολογίας. Η γενική διαδικασία χρησιμοποιεί παραδοσιακές μεθόδους από την εξαγωγή πληροφοριών και την εξαγωγή, τον μετασχηματισμό και τη φόρτωση (ETL), οι οποίες μετατρέπουν τα δεδομένα από τις πηγές σε δομημένες μορφές.
Hellenica World - Scientific Library
Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License