.
Στις Πιθανότητες και στην Στατιστική, η κατανομή πιθανοτήτων αποδίδει την πιθανότητα σε κάθε μετρήσιμο υποσύνολο των πιθανών αποτελεσμάτων του τυχαίου πειράματος,της έρευνα, ή την διαδικασία της επαγωγικής στατιστικής. Παραδείγματα αποτελούν τα πειράματα των οποίων ο δειγματικός χώρος είναι μη-αριθμητικός, όπου η κατανομή θα είναι μια κατηγορική κατανομή. Πειράματα των οποίων ο δειγματικός χώρος αποτελείται από διακριτές τυχαίες μεταβλητές, όπου η κατανομή μπορεί να καθορίζεται από μια συνάρτηση συσσωρευμένης πιθανότητας.Τα πειράματα με δειγματικούς χώρους κωδικοποιούνται από συνεχείς τυχαίες μεταβλητές, όπου η κατανομή μπορεί να καθορίζεται από μια συνάρτηση πυκνότητας πιθανότητας. Πιο πολύπλοκα πειράματα, όπως εκείνα που αφορούν στοχαστικές διαδικασίες που ορίζονται σε συνεχή χρόνο, μπορεί να απαιτήσει τη χρήση των πιο γενικών μέτρων πιθανότητας.
Στην εφαρμοσμένη πιθανότητα, μια κατανομή πιθανοτήτων μπορεί να οριστεί σε μια σειρά από διαφορετικούς τρόπους.Συχνά επιλέγεται για τη μαθηματική ευκολία:
Η παροχή μιας έγκυρης λειτουργία μάζα πιθανότητας ή πυκνότητας πιθανότητας
Η παροχή μιας έγκυρης αθροιστικής συνάρτησης συνάρτηση κατανομής
Η παροχή μιας έγκυρης συνάρτησης κινδύνου
Η παροχή μιας έγκυρης χαρακτηριστικής συνάρτησης
Η παροχή ενός κανόνα για την κατασκευή μιας νέας τυχαίας μεταβλητής από άλλες τυχαίες μεταβλητές των οποίων η κοινή πιθανότητα διανομής είναι γνωστή.
Η κατανομή πιθανοτήτων μπορεί να είναι είτε μονοπαραγοντική είτε πολυπαραγοντική. Η μονοπαραγοντική κατανομή δίνει τις πιθανότητες μιας τυχαίας μεταβλητής, αναλαμβάνοντας διάφορες εναλλακτικές τιμές.Μια πολυμεταβλητή κατανομή (από κοινού κατανομή πιθανότητας) δίνει τις πιθανότητες ενός τυχαίου διανύσματος, ένα σύνολο από δύο ή περισσότερες τυχαίες μεταβλητές, αναλαμβάνοντας διάφορους συνδυασμούς των τιμών. Σημαντικές και συναντώνται συχνά οι κατανομές μονομεταβλητών πιθανοτήτων που περιλαμβάνουν την διωνυμική κατανομή, την εκθετική κατανομή και την κανονική κατανομή. Η πολυμεταβλητή κανονική κατανομή είναι μια συχνά απαντώμενη πολυμεταβλητή κατανομή.
Εισαγωγή
Οι μεταβλητές διακρίνονται σε ποιοτικές(ή κατηγορικές) οι οποίες παίρνουν τιμές που δεν είναι αριθμοί και στις ποσοτικές που οι τιμές που παίρνουν είναι αριθμοί και διακρίνονται σε διακριτές και συνεχείς.
Για να ορίσουμε τις κατανομές πιθανοτήτων για τις απλές περιπτώσεις, πρέπει να γίνει διάκριση μεταξύ διακριτές και συνεχείς τυχαίες μεταβλητές των ποσοτικών μεταβλητών. Στην διακριτές μεταβλητές, κάποιος μπορεί εύκολα να εκχωρήσει μια πιθανότητα σε κάθε πιθανή τιμή: για παράδειγμα, όταν ρίχνοντας ένα αμερόληπτο ζάρι , κάθε μία από τις έξι τιμές 1 έως 6 έχει την πιθανότητα 1/6. Στις συνεχείς μεταβλητές οι τιμές που μπορούν να πάρουν είναι οποιεσδήποτε τιμές που μπορεί να υπάρχουν σε ένα διάστημα (κ,λ) όπου κ,λ ανήκουν στους πραγματικούς αριθμούς.Επίσης σε μια συνεχή μεταβλητή οι πιθανότητες μπορεί να είναι μη μηδενικές μόνο εάν αναφέρονται σε χρονικά διαστήματα.
Ορολογία
Η συνάρτηση μάζας πιθανότητας (PMF) p(S) καθορίζει την κατανομή πιθανοτήτων για το σύνολο S των Η από τα δύο ζάρια. Για παράδειγμα, το σχήμα δείχνει ότι p (11) = 1/18. Η συνάρτηση μάζας πιθανότητας επιτρέπει τον υπολογισμό των πιθανοτήτων των γεγονότων, όπως η P (S> 9) = 1/12 + 1/18 + 1/36 = 1/6, και όλες τις άλλες πιθανότητες στη διανομή.
Η συνάρτηση πυκνότητας πιθανότητας της κανονικής κατανομή, που ονομάζεται επίσης Gaussian ή «καμπύλη καμπάνα", η πιο σημαντική συνεχής τυχαία κατανομή. Όπως στο σχήμα, οι πιθανότητες στα διαστήματα των τιμών αντιστοιχούν προς την περιοχή κάτω από την καμπύλη.
Ως Θεωρία Πιθανοτήτων χρησιμοποιείται σε αρκετά διαφορετικές εφαρμογές, η ορολογία δεν είναι ενιαία και μερικές φορές προκαλεί σύγχυση. Οι ακόλουθοι όροι χρησιμοποιούνται για μη αθροιστική συνάρτηση κατανομής πιθανοτήτων:
Συνάρτηση μάζας, η λειτουργία μαζικής Πιθανότητας, για διακριτές τυχαίες μεταβλητές.
Κατηγορική Κατανομή:για διακριτές τυχαίες μεταβλητές με πεπερασμένο σύνολο τιμών.
Συνάρτηση Πυκνότητας : κυρίως χρησιμοποιείται για συνεχείς μεταβλητές.
Οι ακόλουθοι όροι είναι κάπως ασαφείς, δεδομένου ότι μπορεί να αναφέρεται σε αθροιστικές και μη αθροιστικές κατανομές, ανάλογα με τις προτιμήσεις του συγγραφέα:
Συνάρτηση κατανομής πιθανότητας: συνεχής ή διακριτή, αθροιστική και μη αθροιστική.
Συνάρτηση Πιθανότητας: ακόμα πιο διφορούμενη, μπορεί να σημαίνει οποιοδήποτε από τα παραπάνω ή άλλα πράγματα.
Τέλος,
Κατανομή πιθανότητας: μερικές φορές είναι το ίδιο με την συνάρτηση κατανομής πιθανότητας, αλλά συνήθως αναφέρεται στην πληρέστερη απόδοση πιθανοτήτων σε όλα τα μετρήσιμα υποσύνολα των αποτελεσμάτων, όχι μόνο σε συγκεκριμένα αποτελέσματα ή περιοχές των αποτελεσμάτων.
Αθροιστική συνάρτηση κατανομής
Επειδή μια κατανομή πιθανότητας Pr στην πραγματική γραμμή προσδιορίζεται από την πιθανότητα της τυχαίας μεταβλητής Χ σε ημι-ανοικτό διάστημα (-∞, x], η κατανομή πιθανοτήτων που χαρακτηρίζονται από αθροιστική συνάρτηση κατανομής της είναι:
F(x)=Pr[X≤x] για όλα τα x∈R
Διακριτή κατανομή πιθανότητας
Μια διακριτή κατανομή πιθανότητας είναι μια κατανομή πιθανοτήτων που χαρακτηρίζεται από μια συνάρτηση μάζας πιθανότητας. Έτσι, η κατανομή μιας τυχαίας μεταβλητής Χ είναι διακριτή, και το Χ ονομάζεται διακριτή τυχαία μεταβλητή, αν
ΣPr(X=u)=1
ως u διασχίζει το σύνολο όλων των δυνατών τιμών των Χ.Ως εκ τούτου, μια τυχαία μεταβλητή μπορεί να αναλάβει μόνο ένα πεπερασμένο ή άπειρο αριθμό τιμών.Η τυχαία μεταβλητή είναι μία διακριτή μεταβλητή. Ο αριθμός των πιθανών τιμών είναι άπειρος, ακόμα κι αν οι πιθανότητες τους να πλησιαζουν στο 1, οι πιθανότητες μπορούν να μειωθούν στο μηδέν αρκετά γρήγορα. Για παράδειγμα, εάν Pr(X=u)= 1/2n για n=1,2,... έχουμε το άθροισμα των πιθανοτήτων 1/2 + 1/4 + 1/8 + ... = 1
Η λειτουργία της πιθανότητας μια διακριτή κατανομής. Οι πιθανότητες των μονοσύνολων {1}, {3} και {7} είναι αντίστοιχα 0.2, 0.5, 0.3. Ένα σύνολο που δεν περιέχει κάποιο από αυτά τα σημεία έχει μηδενική πιθανότητα
Είναι γνωστό ότι οι διακριτές κατανομές πιθανοτήτων που χρησιμοποιούνται στη στατιστική μοντελοποίηση περιλαμβάνουν την κατανομή Poisson, την κατανομή Bernoulli,την διωνυμική κατανομή, την γεωμετρική κατανομή, και την αρνητική διωνυμική κατανομή. Επιπλέον, η διακριτή ομοιόμορφη κατανομή χρησιμοποιείται συνήθως σε προγράμματα ηλεκτρονικών υπολογιστών που κάνουν ίσης πιθανότητας τυχαίες επιλογές μεταξύ ενός αριθμού επιλογών.
Συνεχής κατανομή πιθανότητας
Μια συνεχής κατανομή πιθανότητας είναι μια κατανομή πιθανοτήτων που έχει συνάρτηση πυκνότητας πιθανότητας.Πολλοί Μαθηματικοί αποκαλούν, επίσης, μια τέτοια διανομή απόλυτα συνεχής, δεδομένου ότι αθροιστική συνάρτηση κατανομής της είναι απολύτως συνεχής σε σχέση με το μέτρο λ Lebesgue. Αν η κατανομή του Χ είναι συνεχής, τότε το Χ ονομάζεται συνεχής τυχαία μεταβλητή. Υπάρχουν πολλά παραδείγματα της συνεχούς κατανομής πιθανότητας όπως: κανονική, ομοιόμορφη, chi-τετράγωνο, και άλλα.
Διαισθητικά, μία συνεχής τυχαία μεταβλητή είναι εκείνη η οποία μπορεί να λάβει μια συνεχή σειρά από τιμές, σε αντίθεση με μια διακριτή κατανομή, όπου το σύνολο των πιθανών τιμών για την τυχαία μεταβλητή είναι υπολογίσιμο. Ενώ για μια διακριτή κατανομή ένα γεγονός με πιθανότητα μηδέν είναι αδύνατο (π.χ., να φέρεις 3½ σε ένα αμερόληπτο ζάρι είναι αδύνατο, και έχει πιθανότητα μηδέν),στην περίπτωση της συνεχούς τυχαίας μεταβλητής αυτό δεν συμβαίνει .Για παράδειγμα, εάν κάποιος μετρά το πλάτος ενός φύλλου δρυός, το αποτέλεσμα της 3½ εκατοστά είναι δυνατόν να συμβεί.Ωστόσο, έχει πιθανότητα μηδέν επειδή υπάρχουν πολλές άλλες πιθανές τιμές, ακόμη και μεταξύ 3 cm και 4 cm. Κάθε ένα από αυτά τα επιμέρους αποτελέσματα έχει μηδενική πιθανότητα, αλλά η πιθανότητα ότι το αποτέλεσμα θα ανήκει στο διάστημα (3 εκατοστών, 4 εκατοστά) είναι μη μηδενική. Αυτό το φαινομενικά παράδοξο λύνεται από το γεγονός ότι η πιθανότητα του Χ αποκτά κάποια τιμή μέσα σε ένα άπειρο σύνολο. Επισήμως, κάθε πιθανή τιμή έχει μια απειροελάχιστη πιθανότητα, η οποία στατιστικά είναι ισοδύναμη με το μηδέν.
Επισήμως, εάν το Χ είναι μια συνεχής τυχαία μεταβλητή, τότε έχει μια ƒ συνάρτηση πυκνότητας πιθανότητας (x), και ως εκ τούτου την πιθανότητα να ανήκουν σε ένα δεδομένο χρονικό διάστημα, ας πούμε [a, b] δίνεται από το ολοκλήρωμα
\( \Pr[a\le X\le b] = \int_a^b f(x) \, dx \)
Ειδικότερα, η πιθανότητα για το Χ να λάβει μια συγκεκριμένη τιμή (δηλαδή a ≤ X ≤ a) είναι μηδέν, επειδή η πιθανότητα να συμπίπτουν τα άνω και τα κάτω όρια είναι πάντοτε ίση με μηδέν.
Ο ορισμός αναφέρει ότι μια συνεχής κατανομή πιθανοτήτων πρέπει να έχει πυκνότητα, ή ισοδύναμα την αθροιστική συνάρτηση κατανομής της απολύτως συνεχής. Η απαίτηση αυτή είναι ισχυρότερη από απλή συνέχεια της αθροιστική συνάρτηση κατανομής, και υπάρχει μια ειδική κατηγορία των κατανομών που δεν είναι ούτε συνεχής ούτε διακριτές ούτε ένα μίγμα από αυτά. Ένα παράδειγμα δίνεται από την κατανομή Cantor. Τέτοιες όμως ποτέ δεν συναντώνται στην πράξη.
Σημείωση σχετικά με την ορολογία: κάποιοι συγγραφείς χρησιμοποιούν τον όρο «συνεχής διανομή" για να υποδηλώσουν τη διανομή με συνεχή αθροιστική συνάρτηση κατανομής.
Μια σύμβαση αναφέρει ότι μια κατανομή πιθανοτήτων μ λέγεται συνεχής αν η αθροιστική συνάρτηση κατανομής F (x) του = μ(- ∞, x] είναι συνεχής και, ως εκ τούτου, το μέτρο της πιθανότητας μ{x}=0 για κάθε x.
Μια άλλη σύμβαση διατηρεί το όρο συνεχή κατανομή πιθανότητας για απολύτως συνεχείς κατανομές. Αυτές οι κατανομές μπορούν να χαρακτηρίζονται από μια συνάρτηση πυκνότητας πιθανότητας: μια μη-αρνητική Lebesgue συνάρτηση f που ορίζεται επί των πραγματικών αριθμών τέτοια ώστε
\( F(x) = \mu(-\infty,x] = \int_{-\infty}^x f(t)\,dt. \)
Παραπομπές
B. S. Everitt: The Cambridge Dictionary of Statistics, Cambridge University Press, Cambridge (3rd edition, 2006). ISBN 0-521-69027-7
Bishop: Pattern Recognition and Machine Learning, Springer, ISBN 0-387-31073-8
den Dekker A. J., Sijbers J., (2014) "Data distributions in magnetic resonance images: a review", Physica Medica
Εξωτερικοί σύνδεσμοι
Hazewinkel, Michiel, ed. (2001), "Probability distribution", Encyclopedia of Mathematics, Springer, ISBN 978-1-55608-010-4
Hellenica World - Scientific Library
Από τη ελληνική Βικιπαίδεια http://el.wikipedia.org . Όλα τα κείμενα είναι διαθέσιμα υπό την GNU Free Documentation License