αγγλικά : DBpedia
γαλλικά : DBpedia
γερμανικά : DBpedia
Η DBpedia (από το "DB" για "βάση δεδομένων") είναι ένα έργο που στοχεύει στην εξαγωγή δομημένου περιεχομένου από τις πληροφορίες που δημιουργούνται στο έργο της Wikipedia. Αυτές οι δομημένες πληροφορίες διατίθενται στον Παγκόσμιο Ιστό.[1] Το DBpedia επιτρέπει στους χρήστες να ρωτούν σημασιολογικά τις σχέσεις και τις ιδιότητες των πόρων της Wikipedia, συμπεριλαμβανομένων συνδέσμων προς άλλα σχετικά σύνολα δεδομένων.[2]
Το 2008, ο Tim Berners-Lee περιέγραψε την DBpedia ως ένα από τα πιο διάσημα μέρη της προσπάθειας αποκεντρωμένων Συνδεδεμένων Δεδομένων.[3]
Ιστορικό
Το έργο ξεκίνησε από άτομα του Ελεύθερου Πανεπιστημίου του Βερολίνου και του Πανεπιστημίου της Λειψίας[4] σε συνεργασία με το Λογισμικό OpenLink, και τώρα συντηρείται από άτομα στο Πανεπιστήμιο του Mannheim και στο Πανεπιστήμιο της Λειψίας.[5][6] Το πρώτο δημοσίως διαθέσιμο σύνολο δεδομένων δημοσιεύτηκε το 2007.[4] Τα δεδομένα διατίθενται με δωρεάν άδειες χρήσης (CC-BY-SA), επιτρέποντας σε άλλους να χρησιμοποιήσουν ξανά το σύνολο δεδομένων. Ωστόσο, δεν χρησιμοποιεί άδεια ανοιχτών δεδομένων για να παραιτηθεί από τα sui generis δικαιώματα βάσης δεδομένων. ]
Τα άρθρα της Wikipedia αποτελούνται κυρίως από ελεύθερο κείμενο, αλλά περιλαμβάνουν επίσης δομημένες πληροφορίες ενσωματωμένες στα άρθρα, όπως πίνακες "infobox" (τα αναδυόμενα πλαίσια που εμφανίζονται στην επάνω δεξιά γωνία της προεπιλεγμένης προβολής πολλών άρθρων της Wikipedia ή στην αρχή του τις εκδόσεις για κινητά), πληροφορίες κατηγοριοποίησης, εικόνες, γεωσυντεταγμένες και συνδέσμους προς εξωτερικές ιστοσελίδες. Αυτές οι δομημένες πληροφορίες εξάγονται και τοποθετούνται σε ένα ενιαίο σύνολο δεδομένων για το οποίο μπορείτε να γίνει αναζήτηση.
Η κυκλοφορία του συνόλου δεδομένων DBpedia για το 2016-04 περιγράφει 6,0 εκατομμύρια οντότητες, από τις οποίες 5,2 εκατομμύρια ταξινομούνται σε μια συνεπή οντολογία, συμπεριλαμβανομένων 1,5 εκατομμυρίων ατόμων, 810.000 τοποθεσιών, 135.000 μουσικών άλμπουμ, 106.000 ταινιών, 20,000 βίντεο 301,000 είδη και 5.000 ασθένειες.[7] Η DBpedia χρησιμοποιεί το Πλαίσιο Περιγραφής Πόρων (RDF) για να αναπαραστήσει εξαγόμενες πληροφορίες και αποτελείται από 9,5 δισεκατομμύρια τριάδες RDF, εκ των οποίων 1,3 δισεκατομμύρια εξήχθησαν από την αγγλική έκδοση της Wikipedia και 5,0 δισεκατομμύρια από άλλες γλωσσικές εκδόσεις.[7]
Από αυτό το σύνολο δεδομένων, μπορούν να εξαχθούν πληροφορίες διασκορπισμένες σε πολλές σελίδες. Για παράδειγμα, η συγγραφή βιβλίων μπορεί να συνδυαστεί από σελίδες σχετικά με το έργο ή τον συγγραφέα.
Μία από τις προκλήσεις στην εξαγωγή πληροφοριών από τη Wikipedia είναι ότι οι ίδιες έννοιες μπορούν να εκφραστούν χρησιμοποιώντας διαφορετικές παραμέτρους στο infobox και άλλα πρότυπα, όπως |birthplace= και |placeofbirth=. Εξαιτίας αυτού, τα ερωτήματα σχετικά με το πού γεννήθηκαν οι άνθρωποι θα πρέπει να αναζητήσουν και τις δύο αυτές ιδιότητες για να λάβουν πιο ολοκληρωμένα αποτελέσματα. Ως αποτέλεσμα, η Γλώσσα χαρτογράφησης DBpedia αναπτύχθηκε για να βοηθήσει στην αντιστοίχιση αυτών των ιδιοτήτων σε μια οντολογία, μειώνοντας παράλληλα τον αριθμό των συνωνύμων. Λόγω της μεγάλης ποικιλίας πλαισίων πληροφοριών και ιδιοτήτων που χρησιμοποιούνται στη Wikipedia, η διαδικασία ανάπτυξης και βελτίωσης αυτών των αντιστοιχίσεων έχει ανοίξει για δημόσιες συνεισφορές.[8]
Hellenica World - Scientific Library
Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License