Densità della distribuzione di probabilità. Aspettativa di una variabile casuale continua
Vengono fornite le definizioni della funzione di distribuzione di una variabile casuale e della densità di probabilità di una variabile casuale continua. Questi concetti vengono utilizzati attivamente negli articoli sulle statistiche dei siti Web. Vengono considerati esempi di calcolo della funzione di distribuzione e della densità di probabilità utilizzando le funzioni MS EXCEL..
Introduciamo i concetti di base della statistica, senza i quali è impossibile spiegare concetti più complessi.
Popolazione e variabile casuale
Facciamolo popolazione(popolazione) di N oggetti, ciascuno dei quali ha un certo valore di qualche caratteristica numerica X.
Un esempio di popolazione generale (GS) è un insieme di pesi di parti simili prodotte da una macchina.
Da quando statistica matematica, qualsiasi conclusione viene fatta solo sulla base delle caratteristiche X (astraendo dagli oggetti stessi), quindi da questo punto di vista popolazione rappresenta N numeri, tra i quali, nel caso generale, possono essercene identici.
Nel nostro esempio, GS è semplicemente un array numerico di valori di peso della parte. X è il peso di una delle parti.
Se da un dato GS selezioniamo casualmente un oggetto avente la caratteristica X, allora il valore di X è variabile casuale. Per definizione, qualsiasi variabile casuale ha funzione distributiva, che di solito è indicato con F(x).
Funzione di distribuzione
Funzione di distribuzione probabilità variabile casuale X è una funzione F(x), il cui valore nel punto x è uguale alla probabilità dell'evento X F(x) = P(X Spieghiamo usando la nostra macchina come esempio. Anche se la nostra macchina dovrebbe produrre un solo tipo di pezzo, è ovvio che il peso dei pezzi prodotti sarà leggermente diverso l'uno dall'altro. Ciò è possibile perché nella produzione potrebbero essere utilizzati materiali diversi e anche le condizioni di lavorazione potrebbero variare leggermente, ecc. Lascia che la parte più pesante prodotta dalla macchina pesi 200 ge la più leggera - 190 g la probabilità che la parte selezionata X peserà meno di 200 g è uguale a 1. La probabilità che peserà meno di 190 g è uguale a 0. I valori intermedi sono determinati dalla forma della funzione di distribuzione. Ad esempio, se il processo è impostato per produrre parti del peso di 195 g, è ragionevole supporre che la probabilità di selezionare una parte più leggera di 195 g sia 0,5. Grafico tipico Funzioni di distribuzione per una variabile casuale continua è mostrata nell'immagine seguente (curva viola, vedere il file di esempio): Nella guida di MS EXCEL Funzione di distribuzione chiamato Integrante funzione distributiva (CumulativoDistribuzioneFunzione,
CDF). Ecco alcune proprietà Funzioni di distribuzione: Lascia che te lo ricordiamo densità di distribuzioneè derivato da funzioni di distribuzione, cioè. la “velocità” del suo cambiamento: p(x)=(F(x2)-F(x1))/Dx con Dx tendente a 0, dove Dx=x2-x1. Quelli. il fatto che densità di distribuzione>1 significa solo che la funzione di distribuzione sta crescendo abbastanza rapidamente (questo è ovvio nell'esempio). Nota: L'area interamente contenuta sotto l'intera curva che rappresenta densità di distribuzione, è uguale a 1. Nota: Ricordiamo che la funzione di distribuzione F(x) viene chiamata nelle funzioni MS EXCEL funzione di distribuzione cumulativa. Questo termine è presente nei parametri della funzione, ad esempio DISTRIB.NORM.(x; media; deviazione_standard; integrante). Se la funzione MS EXCEL deve restituire funzione di distribuzione, poi il parametro integrante, d.b. impostato su VERO. Se hai bisogno di calcolare densità di probabilità, quindi il parametro integrante, d.b. MENZOGNA. Nota: Per distribuzione discreta La probabilità che una variabile casuale assuma un certo valore viene spesso chiamata anche densità di probabilità (funzione di massa di probabilità (pmf)). Nella guida di MS EXCEL densità di probabilità può anche essere definita una “funzione di misura della probabilità” (vedere la funzione BINOM.DIST()). È chiaro che per calcolare densità di probabilità per un certo valore di una variabile casuale, è necessario conoscerne la distribuzione. Lo troveremo densità di probabilità per N(0;1) in x=2. Per fare ciò, è necessario scrivere la formula =DIST.ST.NORMALE(2,FALSO)=0,054 o =DISTRIB.NORMALE(2,0,1,FALSO). Lascia che te lo ricordiamo probabilità Quello variabile casuale continua assumerà un valore specifico x è 0. For variabile casuale continua X può essere calcolato solo dalla probabilità dell'evento che X assuma il valore contenuto nell'intervallo (a; b). 1) Troviamo la probabilità che una variabile casuale distribuita da (vedi immagine sopra) assuma un valore positivo. Secondo la proprietà Funzioni di distribuzione la probabilità è F(+∞)-F(0)=1-0,5=0,5. DIST.ST.NORM.(9.999E+307,VERO) -DIST.ST.NORM.(0,VERO) =1-0,5. 2) Trovare la probabilità che una variabile casuale sia distribuita , ha assunto un valore negativo. Secondo la definizione Funzioni di distribuzione la probabilità è F(0)=0,5. In MS EXCEL, per trovare questa probabilità, utilizzare la formula =DIST.ST.NORMALE(0,VERO) =0,5. 3) Trovare la probabilità che una variabile casuale sia distribuita distribuzione normale standardizzata, assumerà il valore contenuto nell'intervallo (0; 1). La probabilità è uguale a F(1)-F(0), cioè dalla probabilità di scegliere X dall'intervallo (-∞;1), bisogna sottrarre la probabilità di scegliere X dall'intervallo (-∞;0). In MS EXCEL utilizzare la formula =DIST.ST.NORM.(1,VERO) - DISTRIB.ST.NORM.(0,VERO). Tutti i calcoli sopra riportati si riferiscono a una variabile casuale distribuita legge normale standard N(0;1). È chiaro che i valori di probabilità dipendono dalla distribuzione specifica. Nell'articolo sulla funzione di distribuzione, trova il punto per cui F(x) = 0,5, quindi trova l'ascissa di questo punto. Ascissa del punto =0, cioè la probabilità che la variabile casuale X assuma quel valore<0, равна 0,5. In MS EXCEL, utilizzare la formula =NORM.ST.REV(0,5) =0. Calcolare senza ambiguità il valore variabile casuale ammette la proprietà della monotonia funzioni di distribuzione. Funzione di distribuzione inversa calcola , che vengono utilizzati, ad esempio, quando . Quelli. nel nostro caso il numero 0 è il quantile 0,5 distribuzione normale. Nel file di esempio puoi calcolarne un altro quantile questa distribuzione. Ad esempio, il quantile 0,8 è 0,84. Nella letteratura inglese funzione di distribuzione inversa spesso definita funzione punto percentuale (PPF). Nota: Durante il calcolo quantili in MS EXCEL vengono utilizzate le seguenti funzioni: NORM.ST.INV(), LOGNORM.INV(), CHI2.INR(), GAMMA.INR(), ecc. Puoi leggere ulteriori informazioni sulle distribuzioni presentate in MS EXCEL nell'articolo. Dispersione la variabile casuale continua X, i cui possibili valori appartengono all'intero asse Ox, è determinata dall'uguaglianza: Scopo del servizio. Il calcolatore online è progettato per risolvere i problemi in cui entrambi densità di distribuzione f(x) o funzione di ripartizione F(x) (vedi esempio). Di solito in tali compiti devi trovare aspettativa matematica, deviazione standard, tracciare grafici delle funzioni f(x) e F(x). Istruzioni. Selezionare il tipo di dati di origine: densità di distribuzione f(x) o funzione di distribuzione F(x). La densità di distribuzione f(x) è data: La funzione di distribuzione F(x) è data: Una variabile casuale continua è specificata da una densità di probabilità Viene chiamata la variabile casuale X continuo
, se la sua funzione di distribuzione F(X)=P(X< x) непрерывна и имеет производную.
Calcolo della densità di probabilità utilizzando le funzioni MS EXCEL
Calcolo delle probabilità utilizzando le funzioni MS EXCEL
Invece di +∞, il valore inserito nella formula è 9.999E+307= 9.999*10^307, che è il numero massimo che può essere inserito in una cella MS EXCEL (il più vicino a +∞, per così dire).
(Legge sulla distribuzione di Rayleigh - utilizzata nell'ingegneria radiofonica). Trova M(x) , D(x) .
La funzione di distribuzione di una variabile casuale continua viene utilizzata per calcolare la probabilità che una variabile casuale rientri in un dato intervallo:
P(α< X < β)=F(β) - F(α)
Inoltre, per una variabile casuale continua, non importa se i suoi confini sono inclusi o meno in questo intervallo:
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Densità di distribuzione
una variabile casuale continua è chiamata funzione
f(x)=F’(x) , derivata della funzione di distribuzione.Proprietà della densità di distribuzione
1. La densità di distribuzione della variabile casuale è non negativa (f(x) ≥ 0) per tutti i valori di x.
2. Condizione di normalizzazione:
Il significato geometrico della condizione di normalizzazione: l'area sotto la curva di densità di distribuzione è uguale all'unità.
3. La probabilità che una variabile casuale X rientri nell'intervallo da α a β può essere calcolata utilizzando la formula
Dal punto di vista geometrico, la probabilità che una variabile casuale continua X rientri nell'intervallo (α, β) è uguale all'area del trapezio curvilineo sotto la curva di densità di distribuzione basata su questo intervallo.
4. La funzione di distribuzione è espressa in termini di densità come segue:
Il valore della densità di distribuzione nel punto x non è uguale alla probabilità di accettare questo valore; per una variabile casuale continua si può parlare solo di probabilità di cadere in un dato intervallo; Permettere .
Per una variabile casuale discreta
M[X] =
Per una variabile casuale continua
Moda– questo è il valore più probabile della variabile casuale (quello per il quale la probabilità p i , ovvero la densità di distribuzione f(x) raggiunge un massimo).
Designazione:
Esistono distribuzioni unimodali (hanno una modalità), distribuzioni polimodali (hanno diverse modalità) e animemodali (non hanno modalità).
unimodale
Mediano– questo è il valore della variabile casuale x m per la quale vale la seguente uguaglianza:
P(X< х m }= P{X >xm)
La mediana divide a metà l'area delimitata da f(x).
Se la densità di distribuzione di una variabile casuale è simmetrica e unimodale, allora M[X], e x m coincidono
M[X], , x m – quantità non casuali
Densità di probabilità di una variabile casuale continua, sua definizione, proprietà e grafico.
Si dice che una variabile casuale X abbia una distribuzione (distribuita) con densità
su una determinata sezione dell'asse x. Densità di probabilità
, come la funzione di distribuzione F(x), è una delle forme della legge di distribuzione, ma a differenza della funzione di distribuzione esiste solo per continuo
variabili casuali
. A volte viene chiamata la densità di probabilità funzione differenziale
O legge di distribuzione differenziale
. Grafico della densità di probabilità
chiamato curva di distribuzione
.
Proprietà della densità di probabilità di una variabile casuale continua.
☺
come derivata di una funzione monotonicamente non decrescente F(x). ☻
☺
Secondo la proprietà 4 della funzione di distribuzione. Poiché F(x) è una primitiva per la densità di probabilità
(Perché
, allora secondo la formula di Newton-Leibniz, l'incremento della primitiva sul segmento [a,b] è un integrale definito
.
☻
La probabilità ottenuta geometricamente è pari all'area della figura delimitata superiormente dalla curva di distribuzione e basata sul segmento [a,b] (Fig. 3.8).
La funzione di distribuzione di una variabile casuale continua può essere espressa in termini di densità di probabilità secondo la formula:
.
Geometricamente, la funzione di distribuzione è uguale all'area della figura delimitata sopra la curva di distribuzione e situata a sinistra del punto x (Fig. 3.9).
Dal punto di vista geometrico, le proprietà 1 e 4 della densità di probabilità significano che il suo grafico - la curva di distribuzione - non si trova al di sotto dell'asse delle ascisse, e l'area totale della figura delimitata dalla curva di distribuzione e dall'asse delle ascisse è uguale a uno.
Una variabile casuale distribuita secondo la legge binomiale, la sua aspettativa matematica e la sua varianza. Legge di distribuzione di Poisson.
Definizione. Ha la variabile casuale discreta X legge di distribuzione binomiale con parametri npq, se assume valori 0, 1, 2,..., m,... ,n con probabilità
dove 0<р Come vediamo, le probabilità P(X=m) si trovano utilizzando la formula di Bernoulli, quindi la legge della distribuzione binomiale è la legge di distribuzione del numero X=m occorrenze dell'evento A in n prove indipendenti, in ciascuna delle quali si verifica può verificarsi con la stessa probabilità p . La serie di distribuzione della legge binomiale ha la forma: È ovvio che la definizione della legge binomiale è corretta, perché proprietà principale di una serie di distribuzione Aspettativa
variabile casuale X, distribuita secondo la legge binomiale, e la sua varianza Definizione.
Ha la variabile casuale discreta X Legge di distribuzione di Poisson
con parametro λ > 0, se assume i valori 0, 1, 2,..., m, ... (un insieme di valori infinito ma numerabile) con probabilità La serie di distribuzioni della legge di Poisson ha la forma: È ovvio che la definizione della legge di Poisson è corretta, essendo la proprietà principale delle serie di distribuzione Nella fig. La Figura 4.1 mostra un poligono (poligono) della distribuzione di una variabile casuale distribuita secondo la legge di Poisson Р(Х=m)=Р m (λ) con parametri λ = 0,5, λ = 1, λ = 2, λ = 3,5. Teorema.
Aspettativa e varianza
di una variabile casuale distribuita secondo la legge di Poisson coincidono e sono pari al parametro λ di tale legge, cioè E 1. Densità di probabilità di una variabile casuale continua La funzione di distribuzione di una variabile casuale continua è la sua caratteristica probabilistica completa. Ma ha lo svantaggio che è difficile giudicare da esso la natura della distribuzione di una variabile casuale in un piccolo intorno dell'uno o dell'altro punto sull'asse numerico. Una rappresentazione più visiva della natura della distribuzione di una variabile casuale continua in prossimità di vari punti è data da una funzione chiamata densità di distribuzione di probabilità o legge di distribuzione differenziale di una variabile casuale. In questa domanda considereremo la funzione di densità di probabilità e le sue proprietà. Sia una variabile casuale continua X con funzione distributiva. Calcoliamo la probabilità che questa variabile casuale rientri in un'area elementare Confrontiamo questa probabilità con la lunghezza della sezione La relazione risultante viene chiamata probabilità media, che è per unità di lunghezza di questa sezione. Considerando la funzione di distribuzione F(X) differenziabile, passiamo nell'uguaglianza (1) al limite a Limite del rapporto tra la probabilità che una variabile casuale continua cada su un tratto elementare da x a x+∆x e la lunghezza di tale tratto ∆x,
quando ∆x
tende a zero, è chiamata densità di distribuzione della variabile casuale nel punto x ed è denotataF
(X).
In virtù dell'uguaglianza (2), la densità di distribuzione F(X) uguale alla derivata della funzione di distribuzione F(X), cioè. . Il significato della densità di distribuzione F(X)è che indica quanto spesso appare una variabile casuale X in qualche zona del punto X quando si ripetono gli esperimenti. Curva raffigurante la densità di distribuzione F(X) si chiama variabile casuale curva di distribuzione. Una vista approssimativa della curva di distribuzione è presentata in Fig. 1. Si noti che se i possibili valori di una variabile casuale riempiono un certo intervallo finito, allora la densità di distribuzione F(X)
=
0
al di fuori di questo intervallo. Selezioniamo sull'asse delle ascisse una sezione elementare ∆ X, adiacente al punto X(Fig. 2) e trova la probabilità di colpire una variabile casuale X
a questa zona. Da un lato, questa probabilità è uguale all'incremento Va notato che non tutte le variabili casuali i cui possibili valori riempiono continuamente un certo intervallo sono variabili casuali continue. Esistono variabili casuali, i cui possibili valori riempiono continuamente un certo intervallo, ma per le quali la funzione di distribuzione non è continua ovunque, ma presenta discontinuità in certi punti. Tali variabili casuali vengono chiamate misto. Ad esempio, nel problema della rivelazione di un segnale nel rumore, l'ampiezza del segnale utile è una variabile casuale mista X, che può assumere qualsiasi valore, sia positivo che negativo. Diamo ora una definizione più rigorosa di variabile casuale continua. Variabile casualeXsi dice continua se la sua funzione di distribuzioneF(x\ è continua lungo tutto l'asse Ox e la densità di distribuzioneF
(X) esiste ovunque, tranne forse per un numero finito di punti. Consideriamo le proprietà della densità di distribuzione. Proprietà 1.La densità di distribuzione è non negativa, cioè. Questa proprietà deriva direttamente dal fatto che la densità di distribuzione Proprietà 2.
La funzione di distribuzione di una variabile casuale è uguale all'integrale della densità nell'intervallo da – ∞ a x, cioè. .
(3) Proprietà 3.Probabilità di incontrare una variabile casuale continuaXal sito .
(4) Proprietà 4.
L'integrale sui limiti infiniti della densità di distribuzione è uguale all'unità: . Se l'intervallo dei possibili valori di una variabile casuale ha limiti finiti UN E B,
poi la densità di distribuzione F(X)= 0 fuori dallo spazio
. Esempio. X
Variabile casuale . è soggetto alla legge di distribuzione con densità Necessario: 1) Trova il coefficiente UN. 2) Trovare la probabilità che una variabile casuale rientri nell'area compresa tra 0 e . Soluzione UN. 1) Determinare il coefficiente , Usiamo la proprietà 4 della densità di distribuzione: . Dove . 2) Secondo la formula (4) abbiamo: viene chiamato il suo valore al quale la densità di distribuzione è massima.
Mediano variabile casuale continua X è un valore per il quale è ugualmente probabile che la variabile casuale sarà minore o maggiore , questo è: Dal punto di vista geometrico, la moda è l'ascissa del punto della curva di distribuzione la cui ordinata è massima (per una variabile casuale discreta, la moda è l'ascissa del punto del poligono con ordinata massima). Geometricamente la mediana è l'ascissa del punto in cui l'area delimitata dalla curva di distribuzione è divisa a metà. Si noti che se la distribuzione è unimodale e simmetrica, allora l'aspettativa matematica, la moda e la mediana sono le stesse. Da notare anche il terzo momento centrale Abbiamo discusso le formule per trovare l'asimmetria e la curtosi nella lezione precedente. 2.Distribuzione normale ,
(5) Tra le distribuzioni di variabili casuali continue, il posto centrale è occupato dalla legge normale o legge della distribuzione gaussiana, la cui densità di probabilità ha la forma: – parametri della distribuzione normale. Poiché la distribuzione normale dipende da due parametri distribuzione a due parametri. X La legge della distribuzione normale si applica nei casi in cui la variabile casuale X influiscono in modo insignificante ed è impossibile indicare quale sia più significativo degli altri. Esempi di variabili casuali che hanno una distribuzione normale includono: deviazione delle dimensioni effettive delle parti lavorate su una macchina dalle dimensioni nominali, errori di misurazione, deviazioni durante la ripresa e altro. Dimostriamo che nella formula (5) il parametro UNè l'aspettativa matematica e il parametro . Il primo degli integrali è uguale a zero, poiché l'integrando è dispari. Il secondo integrale è noto come integrale di Poisson: . Calcoliamo la varianza: . Il grafico della densità di probabilità di una distribuzione normale è chiamato curva gaussiana normale (Fig. 3). Notiamo alcune proprietà della curva: 1.La funzione di densità di probabilità è definita sull'intero asse numerico, cioè 2. Gamma di funzioni 3. I rami della curva gaussiana tendono asintoticamente verso l'asse 4.La curva è simmetrica rispetto alla linea retta 5.La funzione ha un massimo nel punto dell'ascissa 6. La curva gaussiana ha due punti di flesso con coordinate 7.Se, con invariato 8. L'asimmetria e la curtosi per una distribuzione normale sono pari a zero. Troviamo la probabilità che una variabile casuale distribuita secondo la legge normale rientri nell'area . . Utilizzo della sostituzione delle variabili , .
(6) Integrante . Dopo semplici trasformazioni, otteniamo una formula per la probabilità che una variabile casuale rientri in un dato intervallo .
(7) La funzione di Laplace ha le seguenti proprietà: 1. 2. 3.
Il grafico della funzione di distribuzione è mostrato in Fig. 4. Sia necessario calcolare la probabilità che la deviazione di una variabile casuale normalmente distribuita X in valore assoluto non supera un dato numero positivo , cioè la probabilità della disuguaglianza Usiamo la formula (7) e la proprietà dispari della funzione di Laplace: . Mettiamo . Ciò significa che per una variabile casuale normalmente distribuita con parametri UN E
fatto perché non è altro che la somma di tutti i termini dell'espansione del binomio di Newton:
,
soddisfatto, perché la somma della serie.
:
:
; quindi otteniamo:
funzioni di distribuzione F(X), incremento corrispondente ∆
X=
dx
discussione X. CON d'altra parte, la probabilità che una variabile casuale si verifichi X
ad una trama elementare dxCon precisione fino agli infinitesimi di ordine superiore a ∆ X uguale a F(X)
dx
(Perché ∆
F(X)≈
dF(x) =F
(X)
dx).
Dal punto di vista geometrico, questa è l'area di un rettangolo elementare con altezza F(X)
e la base dx
(Fig. 2). Grandezza F
(X)
dx
chiamato elemento di probabilità...
è la derivata della funzione di distribuzione non decrescente F(X).
pari all'integrale della densità di distribuzione rilevata in questa sezione, cioè.
e la proprietà 4 può quindi essere scritta come segue:
Moda variabile casuale continua X
o l’asimmetria serve come caratteristica dell’“asimmetria” della distribuzione. Se la distribuzione è simmetrica rispetto all'aspettativa matematica, allora per la curva di distribuzione (istogramma) . Quarto punto centrale serve per caratteristiche di distribuzione a punta o piatta. Queste proprietà di distribuzione sono descritte utilizzando il cosiddetto eccesso.
Dove
E , quindi viene anche chiamato
– deviazione standard:
.
, cioè la curva gaussiana si trova sopra l'asse x e non lo interseca.
, questo è
. Pertanto, per una distribuzione normale, l'aspettativa matematica coincide con la moda e la mediana della distribuzione.
, uguale
. Con aumento
la curva gaussiana diventa più piatta e man mano che diminuisce
– più “appuntito”.
E
.
cambia l'aspettativa matematica, quindi la curva gaussiana si sposterà lungo l'asse
: a destra – quando si aumenta UN e a sinistra – durante la diminuzione.
. Questo è noto
non è espresso tramite funzioni elementari, quindi per calcolare l'integrale (6) si utilizzano tabelle di valori di una funzione speciale, che si chiama Funzione di Laplace, ed ha la forma:
:
.
è una funzione strana.
.
.
e scegli
. Quindi otteniamo:
compimento della disuguaglianza
è un evento quasi certo. Questa è la cosiddetta regola dei “tre sigma”.