Densidad de distribución de probabilidad. Expectativa de una variable aleatoria continua
Se dan las definiciones de la función de distribución de una variable aleatoria y la densidad de probabilidad de una variable aleatoria continua. Estos conceptos se utilizan activamente en artículos sobre estadísticas de sitios web. Se consideran ejemplos de cálculo de la función de distribución y la densidad de probabilidad utilizando funciones de MS EXCEL..
Introduzcamos los conceptos básicos de la estadística, sin los cuales es imposible explicar conceptos más complejos.
Población y variable aleatoria.
Déjanos tener población(población) de N objetos, cada uno de los cuales tiene un cierto valor de alguna característica numérica X.
Un ejemplo de población general (GS) es un conjunto de pesos de piezas similares producidas por una máquina.
Desde en estadística matemática, cualquier conclusión se llega únicamente sobre la base de las características X (haciendo abstracción de los objetos mismos), entonces desde este punto de vista población representa N números, entre los cuales, en el caso general, pueden haber números idénticos.
En nuestro ejemplo, GS es simplemente una matriz numérica de valores de peso de las piezas. X es el peso de una de las piezas.
Si de un GS determinado seleccionamos aleatoriamente un objeto que tenga la característica X, entonces el valor de X es variable aleatoria. Por definición, cualquier valor aleatorio Tiene función de distribución, que normalmente se denota como F(x).
Función de distribución
Función de distribución probabilidades variable aleatoria X es una función F(x), cuyo valor en el punto x es igual a la probabilidad del evento X F(x) = P(X Expliquemos usando nuestra máquina como ejemplo. Aunque se supone que nuestra máquina produce solo un tipo de pieza, es obvio que el peso de las piezas producidas será ligeramente diferente entre sí. Esto es posible debido al hecho de que en la fabricación se pueden utilizar diferentes materiales y las condiciones de procesamiento también pueden variar ligeramente, etc. Supongamos que la pieza más pesada producida por la máquina pesa 200 gy la más ligera, 190 g. La probabilidad de que la pieza X seleccionada pese menos de 200 g es igual a 1. La probabilidad de que pese menos de 190 g es igual a 0. Los valores intermedios están determinados por la forma de la función de distribución. Por ejemplo, si el proceso está configurado para producir piezas que pesen 195 g, entonces es razonable suponer que la probabilidad de seleccionar una pieza más ligera que 195 g es 0,5. Gráfico típico Funciones de distribución para una variable aleatoria continua se muestra en la siguiente imagen (curva morada, ver archivo de ejemplo): En ayuda de MS EXCEL Función de distribución llamado Integral función de distribución (AcumulativoDistribuciónFunción,
CDF). Aquí hay algunas propiedades Funciones de distribución: Te recordamos que densidad de distribución se deriva de funciones de distribución, es decir. la “velocidad” de su cambio: p(x)=(F(x2)-F(x1))/Dx con Dx tendiendo a 0, donde Dx=x2-x1. Aquellos. el hecho de que densidad de distribución>1 sólo significa que la función de distribución está creciendo bastante rápido (esto es obvio en el ejemplo). Nota: El área enteramente contenida bajo la curva completa que representa densidad de distribución, es igual a 1. Nota: Recuerde que la función de distribución F(x) se llama en funciones de MS EXCEL función de distribución acumulativa. Este término está presente en los parámetros de la función, por ejemplo DISTR.NORM (x; promedio; desviación_estándar; integral). Si la función MS EXCEL debería regresar función de distribución, entonces el parámetro integral, d.b. establecido en VERDADERO. Si necesitas calcular densidad de probabilidad, entonces el parámetro integral, d.b. MENTIR. Nota: Para distribución discreta La probabilidad de que una variable aleatoria tome un determinado valor también suele denominarse densidad de probabilidad (función de masa de probabilidad (pmf)). En ayuda de MS EXCEL densidad de probabilidad incluso puede denominarse “función de medida de probabilidad” (consulte la función BINOM.DIST()). Es claro que para calcular densidad de probabilidad para un determinado valor de una variable aleatoria, es necesario conocer su distribución. Lo encontraremos densidad de probabilidad para N(0;1) en x=2. Para hacer esto, necesitas escribir la fórmula. =DIST.EST.NORMAL(2,FALSO)=0,054 o =DIST.NORMAL(2,0,1,FALSO). Te recordamos que probabilidad eso variable aleatoria continua tomará un valor específico x es 0. Para variable aleatoria continua X sólo puede calcularse mediante la probabilidad del evento de que X tome el valor contenido en el intervalo (a; b). 1) Encontremos la probabilidad de que una variable aleatoria distribuida por (ver imagen de arriba) tome un valor positivo. según propiedad Funciones de distribución la probabilidad es F(+∞)-F(0)=1-0.5=0.5. DISTR.EST.NORM.(9.999E+307,VERDADERO) -DIST.EST.NORM.(0,VERDADERO) =1-0,5. 2) Encuentre la probabilidad de que una variable aleatoria distribuida , tomó un valor negativo. Según la definición Funciones de distribución la probabilidad es F(0)=0,5. En MS EXCEL, para encontrar esta probabilidad, use la fórmula =DIST.EST.NORMAL(0,VERDADERO) =0,5. 3) Encuentre la probabilidad de que una variable aleatoria distribuida distribución normal estándar, tomará el valor contenido en el intervalo (0; 1). La probabilidad es igual a F(1)-F(0), es decir de la probabilidad de elegir X del intervalo (-∞;1), es necesario restar la probabilidad de elegir X del intervalo (-∞;0). En MS EXCEL use la fórmula =DIST.EST.NORM.(1,VERDADERO) - DISTR.EST.NORM.(0,VERDADERO). Todos los cálculos anteriores se refieren a una variable aleatoria distribuida en ley normal estándar N(0;1). Está claro que los valores de probabilidad dependen de la distribución específica. En el artículo sobre la función de distribución, encuentre el punto para el cual F(x) = 0,5 y luego encuentre la abscisa de este punto. Abscisa del punto =0, es decir la probabilidad de que la variable aleatoria X tome el valor<0, равна 0,5. En MS EXCEL, utilice la fórmula =NORM.ST.REV(0.5) =0. Calcular inequívocamente el valor. variable aleatoria permite la propiedad de monotonicidad funciones de distribución. Función de distribución inversa calcula , que se utilizan, por ejemplo, cuando . Aquellos. en nuestro caso, el número 0 es el cuantil 0,5 distribución normal. En el archivo de ejemplo puedes calcular otro cuantil esta distribución. Por ejemplo, el cuantil 0,8 es 0,84. En la literatura inglesa función de distribución inversa a menudo denominada función de punto porcentual (PPF). Nota: Al calcular cuantiles en MS EXCEL se utilizan las siguientes funciones: NORM.ST.INV(), LOGNORM.INV(), CHI2.INR(), GAMMA.INR(), etc. Puede leer más sobre las distribuciones presentadas en MS EXCEL en el artículo. Dispersión La variable aleatoria continua X, cuyos posibles valores pertenecen a todo el eje Ox, está determinada por la igualdad: Objeto del servicio. La calculadora en línea está diseñada para resolver problemas en los que densidad de distribución f(x) o función de distribución F(x) (ver ejemplo). Por lo general, en tales tareas necesitas encontrar. valor esperado, desviación estándar, trazar gráficas de las funciones f(x) y F(x). Instrucciones. Seleccione el tipo de datos de origen: densidad de distribución f(x) o función de distribución F(x). La densidad de distribución f(x) está dada: La función de distribución F(x) está dada: Una variable aleatoria continua está especificada por una densidad de probabilidad. La variable aleatoria X se llama continuo
, si su función de distribución F(X)=P(X< x) непрерывна и имеет производную.
Cálculo de densidad de probabilidad utilizando funciones MS EXCEL.
Calcular probabilidades usando funciones de MS EXCEL
En lugar de +∞, el valor ingresado en la fórmula es 9.999E+307= 9.999*10^307, que es el número máximo que se puede ingresar en una celda de MS EXCEL (más cercano a +∞, por así decirlo).
(Ley de distribución de Rayleigh, utilizada en ingeniería de radio). Encuentre M(x), D(x).
La función de distribución de una variable aleatoria continua se utiliza para calcular la probabilidad de que una variable aleatoria caiga en un intervalo determinado:
P(α< X < β)=F(β) - F(α)
Además, para una variable aleatoria continua, no importa si sus límites están incluidos en este intervalo o no:
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Densidad de distribución
una variable aleatoria continua se llama función
f(x)=F’(x) , derivada de la función de distribución.Propiedades de la densidad de distribución.
1. La densidad de distribución de la variable aleatoria no es negativa (f(x) ≥ 0) para todos los valores de x.
2. Condición de normalización:
El significado geométrico de la condición de normalización: el área bajo la curva de densidad de distribución es igual a la unidad.
3. La probabilidad de que una variable aleatoria X caiga en el intervalo de α a β se puede calcular mediante la fórmula
Geométricamente, la probabilidad de que una variable aleatoria continua X caiga en el intervalo (α, β) es igual al área del trapecio curvilíneo bajo la curva de densidad de distribución basada en este intervalo.
4. La función de distribución se expresa en términos de densidad de la siguiente manera:
El valor de la densidad de distribución en el punto x no es igual a la probabilidad de aceptar este valor; para una variable aleatoria continua solo podemos hablar de la probabilidad de caer en un intervalo dado. Dejar .
Para una variable aleatoria discreta
M[X] =
Para una variable aleatoria continua
Moda– este es el valor más probable de la variable aleatoria (aquel para el cual la probabilidad p i o la densidad de distribución f(x) alcanza un máximo).
Designación:
Hay distribuciones unimodales (tienen una moda), distribuciones polimodales (tienen varias modas) y animodales (no tienen moda)
unimodal
Mediana– este es el valor de la variable aleatoria x m para el cual se cumple la siguiente igualdad:
P(X< х m }= P{X >xm)
La mediana divide el área delimitada por f(x) por la mitad
Si la densidad de distribución de una variable aleatoria es simétrica y unimodal, entonces M[X], y x m coinciden
M[X], , x m – cantidades no aleatorias
Densidad de probabilidad de una variable aleatoria continua, su definición, propiedades y gráfica.
Se dice que una variable aleatoria X tiene una distribución (distribuida) con densidad
en una determinada sección del eje x. Densidad de probabilidad
, como la función de distribución F(x), es una de las formas de la ley de distribución, pero a diferencia de la función de distribución, existe solo para continuo
variables aleatorias
. La densidad de probabilidad a veces se llama función diferencial
o ley de distribución diferencial
. Gráfico de densidad de probabilidad
llamado curva de distribución
.
Propiedades de la densidad de probabilidad de una variable aleatoria continua.
☺
como derivada de una función monótonamente no decreciente F(x). ☻
☺
Según la propiedad 4 de la función de distribución. Dado que F(x) es una antiderivada de la densidad de probabilidad
(porque
, entonces según la fórmula de Newton-Leibniz, el incremento de la primitiva en el segmento [a,b] es una integral definida
.
☻
La probabilidad obtenida geométricamente es igual al área de la figura delimitada en la parte superior por la curva de distribución y basada en el segmento [a,b] (figura 3.8).
La función de distribución de una variable aleatoria continua se puede expresar en términos de densidad de probabilidad según la fórmula:
.
Geométricamente, la función de distribución es igual al área de la figura delimitada por encima de la curva de distribución y que se encuentra a la izquierda del punto x (figura 3.9).
Geométricamente, las propiedades 1 y 4 de la densidad de probabilidad significan que su gráfica, la curva de distribución, no se encuentra debajo del eje de abscisas, y el área total de la figura delimitada por la curva de distribución y el eje de abscisas es igual a uno.
Una variable aleatoria distribuida según la ley del binomio, su expectativa matemática y varianza. Ley de distribución de Poisson.
Definición. La variable aleatoria discreta X tiene ley de distribución binomial con parámetros npq, si toma valores 0, 1, 2,..., m,... ,n con probabilidades
donde 0<р Como vemos, las probabilidades P(X=m) se encuentran usando la fórmula de Bernoulli, por lo tanto, la ley de distribución binomial es la ley de distribución del número X=m ocurrencias del evento A en n ensayos independientes, en cada uno de los cuales puede ocurrir con la misma probabilidad p . La serie de distribución de la ley binomial tiene la forma: Es obvio que la definición de la ley binomial es correcta, porque propiedad principal de una serie de distribución Valor esperado
variable aleatoria X, distribuida según la ley del binomio, y su varianza Definición.
La variable aleatoria discreta X tiene Ley de distribución de Poisson
con parámetro λ > 0, si toma los valores 0, 1, 2,..., m,... (un conjunto de valores infinito pero contable) con probabilidades La serie de distribución de la ley de Poisson tiene la forma: Es obvio que la definición de la ley de Poisson es correcta, ya que la propiedad principal de la serie de distribución En la Fig. La Figura 4.1 muestra un polígono (polígono) de la distribución de una variable aleatoria distribuida según la ley de Poisson Р(Х=m)=Р m (λ) con parámetros λ = 0,5, λ = 1, λ = 2, λ = 3,5. Teorema.
Expectativa y variación
de una variable aleatoria distribuida según la ley de Poisson coinciden y son iguales al parámetro λ de esta ley, es decir Y 1. Densidad de probabilidad de una variable aleatoria continua La función de distribución de una variable aleatoria continua es su característica probabilística integral. Pero tiene la desventaja de que es difícil juzgar a partir de él la naturaleza de la distribución de una variable aleatoria en una pequeña vecindad de uno u otro punto del eje numérico. Una representación más visual de la naturaleza de la distribución de una variable aleatoria continua en las proximidades de varios puntos viene dada por una función llamada densidad de distribución de probabilidad o ley de distribución diferencial de una variable aleatoria. En esta pregunta consideraremos la función de densidad de probabilidad y sus propiedades. Sea una variable aleatoria continua X con función de distribución. Calculemos la probabilidad de que esta variable aleatoria caiga en un área elemental. Comparemos esta probabilidad con la longitud de la sección. La relación resultante se llama probabilidad promedio, que es por unidad de longitud de esta sección. Considerando la función de distribución F(X) diferenciable, pasemos en igualdad (1) al límite en Límite de la relación entre la probabilidad de que una variable aleatoria continua caiga en una sección elemental de x a x+∆x y la longitud de esta sección ∆x,
cuando ∆x
tiende a cero, se llama densidad de distribución de la variable aleatoria en el punto x y se denotaF
(X).
En virtud de la igualdad (2), la densidad de distribución. F(X) igual a la derivada de la función de distribución F(X), es decir. . El significado de la densidad de distribución. F(X) es que indica con qué frecuencia aparece una variable aleatoria X en algun barrio del punto X al repetir experimentos. Curva que representa la densidad de distribución. F(X) variable aleatoria se llama curva de distribución. En la Fig. 1 se presenta una vista aproximada de la curva de distribución. Tenga en cuenta que si los valores posibles de una variable aleatoria llenan un cierto intervalo finito, entonces la densidad de distribución F(X)
=
0
fuera de este intervalo. Seleccionemos una sección elemental ∆ en el eje de abscisas. X, adyacente al punto X(Fig. 2), y encuentre la probabilidad de acertar con una variable aleatoria X
a esta zona. Por un lado, esta probabilidad es igual al incremento Cabe señalar que no todas las variables aleatorias cuyos valores posibles llenan continuamente un determinado intervalo son variables aleatorias continuas. Existen variables aleatorias cuyos posibles valores llenan continuamente un cierto intervalo, pero para las cuales la función de distribución no es continua en todas partes, sino que tiene discontinuidades en ciertos puntos. Estas variables aleatorias se llaman mezclado. Por ejemplo, en el problema de detectar una señal en ruido, la amplitud de la señal útil es una variable aleatoria mixta. X, que puede tomar cualquier valor, tanto positivo como negativo. Demos ahora una definición más rigurosa de variable aleatoria continua. Valor aleatorioXse llama continua si su función de distribuciónF(x\ es continua a lo largo de todo el eje Ox, y la densidad de distribuciónF
(X) existe en todas partes, excepto quizás en un número finito de puntos. Consideremos las propiedades de la densidad de distribución. Propiedad 1.La densidad de distribución no es negativa, es decir. Esta propiedad se deriva directamente del hecho de que la densidad de distribución Propiedad 2.
La función de distribución de una variable aleatoria es igual a la integral de la densidad en el intervalo de – ∞ a x, es decir. .
(3) Propiedad 3.Probabilidad de encontrar una variable aleatoria continuaXal sitio .
(4) Propiedad 4.
La integral sobre infinitos límites de la densidad de distribución es igual a la unidad: . Si el intervalo de valores posibles de una variable aleatoria tiene límites finitos A Y b,
entonces la densidad de distribución F(X)= 0 fuera de la brecha
. Ejemplo. Valor aleatorio X
está sujeto a la ley de distribución con densidad . Requerido: 1) Encuentra el coeficiente A. 2) Encuentre la probabilidad de que una variable aleatoria caiga en el área de 0 a . Solución. 1) Para determinar el coeficiente A Usemos la propiedad 4 de la densidad de distribución: , dónde . 2) Según la fórmula (4) tenemos: . Moda Mediana
variable aleatoria continua X es un valor para el cual es igualmente probable que la variable aleatoria sea menor o mayor , eso es: Geométricamente, la moda es la abscisa del punto de la curva de distribución cuya ordenada es máxima (para una variable aleatoria discreta, la moda es la abscisa del punto del polígono con la ordenada máxima). Geométricamente, la mediana es la abscisa del punto en el que el área limitada por la curva de distribución se divide por la mitad. Tenga en cuenta que si la distribución es unimodal y simétrica, entonces la expectativa matemática, la moda y la mediana son las mismas. Nótese también que el tercer momento central o la asimetría sirve como característica de la “asimetría” de la distribución. Si la distribución es simétrica con respecto a la expectativa matemática, entonces para la curva de distribución (histograma) 2.Distribución normal Entre las distribuciones de variables aleatorias continuas, el lugar central lo ocupa la ley normal o ley de distribución gaussiana, cuya densidad de probabilidad tiene la forma: ,
(5) Dónde Dado que la distribución normal depende de dos parámetros Y La ley de distribución normal se aplica en los casos en que la variable aleatoria X es el resultado de una gran cantidad de factores diferentes. Cada factor por separado vale X influye de manera insignificante y es imposible indicar cuál es más significativo que los demás. Ejemplos de variables aleatorias que tienen una distribución normal incluyen: desviación de las dimensiones reales de las piezas procesadas en una máquina de las dimensiones nominales, errores de medición, desviaciones durante el rodaje y otras. Demostremos que en la fórmula (5) el parámetro A es la expectativa matemática y el parámetro . La primera de las integrales es igual a cero, ya que el integrando es impar. La segunda integral se conoce como integral de Poisson: . Calculemos la varianza: . El gráfico de densidad de probabilidad de una distribución normal se llama curva gaussiana normal (Fig. 3). Notemos algunas propiedades de la curva: 1.La función de densidad de probabilidad se define en todo el eje numérico, es decir 2. Rango de funciones 3. Las ramas de la curva gaussiana tienden asintóticamente al eje. 4.La curva es simétrica con respecto a la línea recta. 5.La función tiene un máximo en el punto de abscisa. 6. La curva gaussiana tiene dos puntos de inflexión con coordenadas. 7.Si, sin cambios 8. La asimetría y la curtosis de una distribución normal son cero. Encontremos la probabilidad de que una variable aleatoria distribuida según la ley normal caiga en el área . . Usando reemplazo de variables , .
(6) Integral . Después de transformaciones simples, obtenemos una fórmula para la probabilidad de que una variable aleatoria caiga dentro de un intervalo dado. .
(7) La función de Laplace tiene las siguientes propiedades: 1. 2. 3.
El gráfico de la función de distribución se muestra en la Fig. 4. Sea necesario calcular la probabilidad de que la desviación de una variable aleatoria distribuida normalmente X en valor absoluto no excede un número positivo dado , es decir, la probabilidad de la desigualdad Usemos la fórmula (7) y la propiedad de rareza de la función de Laplace: . Pongamos . Esto significa que para una variable aleatoria distribuida normalmente con parámetros A Y
hecho porque no es más que la suma de todos los términos del desarrollo del binomio de Newton:
,
satisfecho, porque la suma de la serie.
:
:
; entonces obtenemos:
funciones de distribución F(X), incremento correspondiente ∆
X=
dx
argumento X. CON por otro lado, la probabilidad de que una variable aleatoria golpee X
a una trama elemental dxCon precisión hasta infinitesimales de orden superior a ∆ X igual a F(X)
dx
(porque ∆
F(X)≈
dF(x) =F
(X)
dx).
Geométricamente, esta es el área de un rectángulo elemental con altura. F(X)
y la base dx
(Figura 2). Magnitud F
(X)
dx
llamado elemento de probabilidad...
es la derivada de la función de distribución no decreciente F(X).
igual a la integral de la densidad de distribución tomada en esta sección, es decir.
y la propiedad 4 se puede escribir de la siguiente manera:
variable aleatoria continua X se llama su valor en el que la densidad de distribución es máxima.
. Cuarto punto central sirve para características de distribución puntiaguda o plana. Estas propiedades de distribución se describen utilizando el llamado exceso. Discutimos las fórmulas para encontrar asimetría y curtosis en la conferencia anterior.
– parámetros de distribución normal.
, entonces también se llama distribución de dos parámetros.
- Desviación Estándar:
.
, es decir, la curva gaussiana se ubica por encima del eje x y no lo cruza.
, eso es
. Por tanto, para una distribución normal, la expectativa matemática coincide con la moda y la mediana de la distribución.
, igual
. Con incremento
la curva gaussiana se vuelve más plana y a medida que disminuye
– más “puntiagudo”.
Y
.
cambiar la expectativa matemática, entonces la curva gaussiana se desplazará a lo largo del eje
: hacia la derecha – al aumentar A, y hacia la izquierda – al disminuir.
. Se sabe que
no se expresa a través de funciones elementales, por lo tanto, para calcular la integral (6) se utilizan tablas de valores de una función especial, la cual se llama función de Laplace, y tiene la forma:
:
.
es una función extraña.
.
.
y elige
. Entonces obtenemos:
cumplimiento de la desigualdad
Es un evento casi seguro. Esta es la llamada regla "tres sigma".