Ejemplo de cómo calcular la varianza. Cómo calcular la varianza de una variable aleatoria

La varianza es una medida de dispersión que describe la desviación comparativa entre los valores de los datos y la media. Es la medida de dispersión más utilizada en estadística, calculada sumando y elevando al cuadrado la desviación de cada valor de datos de la media. La fórmula para calcular la varianza se proporciona a continuación:

s 2 – varianza de la muestra;

x av: media muestral;

norte tamaño de muestra (número de valores de datos),

(x i – x avg) es la desviación del valor promedio para cada valor del conjunto de datos.

Para comprender mejor la fórmula, veamos un ejemplo. No me gusta mucho cocinar, así que rara vez lo hago. Sin embargo, para no pasar hambre, de vez en cuando tengo que acudir al fogón para implementar el plan de saturar mi cuerpo de proteínas, grasas y carbohidratos. El siguiente conjunto de datos muestra cuántas veces cocina Renat cada mes:

El primer paso para calcular la varianza es determinar la media muestral, que en nuestro ejemplo es 7,8 veces por mes. El resto de los cálculos se pueden facilitar utilizando la siguiente tabla.

La fase final del cálculo de la varianza se ve así:

Para aquellos a quienes les gusta hacer todos los cálculos de una sola vez, la ecuación quedaría así:

Usando el método de conteo crudo (ejemplo de cocina)

Hay mas método efectivo cálculo de la varianza, conocido como método de "conteo bruto". Aunque la ecuación puede parecer bastante engorrosa a primera vista, en realidad no da tanto miedo. Puede asegurarse de esto y luego decidir qué método le gusta más.

es la suma de cada valor de datos después de elevar al cuadrado,

es el cuadrado de la suma de todos los valores de datos.

No pierdas la cabeza ahora mismo. Pongamos todo esto en una tabla y verás que aquí hay menos cálculos que en el ejemplo anterior.

Como puede ver, el resultado fue el mismo que cuando se utilizó el método anterior. Ventajas este método se vuelven evidentes a medida que aumenta el tamaño de la muestra (n).

Cálculo de varianza en Excel

Como probablemente ya habrás adivinado, Excel tiene una fórmula que te permite calcular la varianza. Además, a partir de Excel 2010, puedes encontrar 4 tipos de fórmulas de varianza:

1) VARIANCE.V: devuelve la varianza de la muestra. Los valores booleanos y el texto se ignoran.

2) DISP.G: devuelve la varianza de la población. Los valores booleanos y el texto se ignoran.

3) VARIANCE: devuelve la varianza de la muestra, teniendo en cuenta los valores booleanos y de texto.

4) VARIANCE: devuelve la varianza de la población, teniendo en cuenta los valores lógicos y de texto.

Primero, comprendamos la diferencia entre una muestra y una población. Objetivo estadísticas descriptivas es resumir o mostrar datos para obtener rápidamente una imagen global, una visión general, por así decirlo. La inferencia estadística le permite hacer inferencias sobre una población basándose en una muestra de datos de esa población. La población representa todos los resultados o mediciones posibles que nos interesan. Una muestra es un subconjunto de una población.

Por ejemplo, estamos interesados ​​en un grupo de estudiantes de una de las universidades rusas y necesitamos determinar la puntuación media del grupo. Podemos calcular el rendimiento medio de los estudiantes, y luego la cifra resultante será un parámetro, ya que en nuestros cálculos participará toda la población. Sin embargo, si queremos calcular el GPA de todos los estudiantes de nuestro país, entonces este grupo será nuestra muestra.

La diferencia en la fórmula para calcular la varianza entre una muestra y una población es el denominador. Donde para la muestra será igual a (n-1), y para la población general solo n.

Ahora veamos las funciones para calcular la varianza con terminaciones. A, cuya descripción indica que el texto y los valores lógicos se tienen en cuenta en el cálculo. En este caso, al calcular la varianza de un conjunto de datos particular donde ocurren valores no numéricos, Excel interpretará el texto y los valores booleanos falsos como iguales a 0, y los valores booleanos verdaderos como iguales a 1.

Entonces, si tiene una matriz de datos, calcular su varianza no será difícil usando una de las funciones de Excel enumeradas anteriormente.

calculemos enEMSOBRESALIRvarianza muestral y desviación estándar. Calculemos también la varianza. variable aleatoria, si se conoce su distribución.

Consideremos primero dispersión, entonces Desviación Estándar.

varianza muestral

varianza muestral (varianza de la muestra,muestradiferencia) caracteriza la dispersión de valores en la matriz en relación con .

Las 3 fórmulas son matemáticamente equivalentes.

De la primera fórmula queda claro que varianza muestral es la suma de las desviaciones al cuadrado de cada valor en la matriz del promedio, dividido por el tamaño de la muestra menos 1.

variaciones muestras usado función DISP(), Inglés el nombre VAR, es decir Diferencia. A partir de la versión MS EXCEL 2010, se recomienda utilizar su análogo DISP.V(), inglés. el nombre VARS, es decir Varianza de la muestra. Además, a partir de la versión de MS EXCEL 2010, existe la función DISP.Г(), en inglés. el nombre VARP, es decir VARIanza poblacional, que calcula dispersión Para población. Toda la diferencia se reduce al denominador: en lugar de n-1 como DISP.V(), DISP.G() tiene solo n en el denominador. Antes de MS EXCEL 2010, la función VAR() se utilizaba para calcular la varianza de la población.

varianza muestral
=QUADROTCL(Muestra)/(CONTAR(Muestra)-1)
=(SUM(Muestra)-COUNT(Muestra)*PROMEDIO(Muestra)^2)/ (COUNT(Muestra)-1)– fórmula habitual
=SUM((Muestra -PROMEDIO(Muestra))^2)/ (CONTAR(Muestra)-1) –

varianza muestral es igual a 0, solo si todos los valores son iguales entre sí y, en consecuencia, iguales valor promedio. Por lo general, cuanto mayor sea el valor variaciones, mayor será la dispersión de valores en la matriz.

varianza muestral es una estimación puntual variaciones distribución de la variable aleatoria a partir de la cual se hizo muestra. Sobre la construcción intervalos de confianza al evaluar variaciones se puede leer en el artículo.

Varianza de una variable aleatoria

Calcular dispersión variable aleatoria, necesitas saberla.

Para variaciones La variable aleatoria X a menudo se denomina Var(X). Dispersión igual al cuadrado de la desviación de la media E(X): Var(X)=E[(X-E(X)) 2 ]

dispersión calculado por la fórmula:

donde x i es el valor que puede tomar una variable aleatoria y μ es el valor promedio (), p(x) es la probabilidad de que la variable aleatoria tome el valor x.

Si una variable aleatoria tiene , entonces dispersión calculado por la fórmula:

Dimensión variaciones Corresponde al cuadrado de la unidad de medida de los valores originales. Por ejemplo, si los valores de la muestra representan medidas de peso de las piezas (en kg), entonces la dimensión de la varianza sería kg 2 . Esto puede ser difícil de interpretar, por lo que para caracterizar la dispersión de valores, un valor igual a la raíz cuadrada de variacionesDesviación Estándar.

Algunas propiedades variaciones:

Var(X+a)=Var(X), donde X es una variable aleatoria y a es una constante.

Var(aХ)=a 2 Var(X)

Var(X)=E[(X-E(X)) 2 ]=E=E(X 2)-E(2*X*E(X))+(E(X)) 2 =E(X 2)- 2*E(X)*E(X)+(E(X)) 2 =E(X 2)-(E(X)) 2

Esta propiedad de dispersión se utiliza en artículo sobre regresión lineal.

Var(X+Y)=Var(X) + Var(Y) + 2*Cov(X;Y), donde X e Y son variables aleatorias, Cov(X;Y) es la covarianza de estas variables aleatorias.

Si las variables aleatorias son independientes, entonces covarianza es igual a 0, y por lo tanto Var(X+Y)=Var(X)+Var(Y). Esta propiedad de dispersión se utiliza en la derivación.

Demostremos que para cantidades independientes Var(X-Y)=Var(X+Y). De hecho, Var(X-Y)= Var(X-Y)= Var(X+(-Y))= Var(X)+Var(-Y)= Var(X)+Var(-Y)= Var( X)+(- 1) 2 Var(Y)= Var(X)+Var(Y)= Var(X+Y). Esta propiedad de dispersión se utiliza para construir.

Desviación estándar muestral

Desviación estándar muestral es una medida de qué tan dispersos están los valores en una muestra en relación con sus .

Priorato, Desviación Estándar igual a la raíz cuadrada de variaciones:

Desviación Estándar no tiene en cuenta la magnitud de los valores en muestra, pero solo el grado de dispersión de valores a su alrededor. promedio. Para ilustrar esto, demos un ejemplo.

Calculemos la desviación estándar para 2 muestras: (1; 5; 9) y (1001; 1005; 1009). En ambos casos, s=4. Es obvio que la relación entre la desviación estándar y los valores de la matriz difiere significativamente entre muestras. Para tales casos se utiliza El coeficiente de variación.(Coeficiente de variación, CV) - relación Desviación Estándar al promedio aritmética, expresado como porcentaje.

En MS EXCEL 2007 y versiones anteriores para cálculo Desviación estándar muestral se utiliza la función =STDEVAL(), en inglés. nombre STDEV, es decir Desviación Estándar. A partir de la versión de MS EXCEL 2010, se recomienda utilizar su análogo =STDEV.B() , en inglés. nombre STDEV.S, es decir Muestra de desviación estándar.

Además, a partir de la versión de MS EXCEL 2010, existe una función STANDARDEV.G(), en inglés. nombre STDEV.P, es decir Desviación estándar de la población, que calcula Desviación Estándar Para población. Toda la diferencia se reduce al denominador: en lugar de n-1 como en STANARDEV.V(), STANARDEVAL.G() tiene solo n en el denominador.

Desviación Estándar También se puede calcular directamente usando las fórmulas siguientes (ver archivo de ejemplo)
=RAÍZ(QUADROTCL(Muestra)/(CONTAR(Muestra)-1))
=RAÍZ((SUM(Muestra)-CONTAR(Muestra)*PROMEDIO(Muestra)^2)/(CONTAR(Muestra)-1))

Otras medidas de dispersión

La función SQUADROTCL() calcula con una suma de desviaciones al cuadrado de los valores de sus promedio. Esta función devolverá el mismo resultado que la fórmula =DISP.G( Muestra)*CONTROLAR( Muestra) , Dónde Muestra- una referencia a un rango que contiene una matriz de valores de muestra (). Los cálculos en la función QUADROCL() se realizan según la fórmula:

La función SROTCL() también es una medida de la dispersión de un conjunto de datos. La función SROTCL() calcula el promedio de los valores absolutos de las desviaciones de valores de promedio. Esta función devolverá el mismo resultado que la fórmula. =SUMAPRODUCTO(ABS(Muestra-PROMEDIO(Muestra)))/CONTAR(Muestra), Dónde Muestra- un enlace a un rango que contiene una serie de valores de muestra.

Los cálculos en la función SROTCL () se realizan según la fórmula:

Sin embargo, esta característica por sí sola no es suficiente para estudiar una variable aleatoria. Imaginemos a dos tiradores disparando a una diana. Uno dispara con precisión y acierta cerca del centro, mientras que el otro... simplemente se divierte y ni siquiera apunta. Pero lo curioso es que él promedio¡El resultado será exactamente el mismo que el del primer tirador! Esta situación se ilustra convencionalmente mediante las siguientes variables aleatorias:

La expectativa matemática del “francotirador” es igual a , sin embargo, para la “persona interesante”: – ¡también es cero!

Por lo tanto, es necesario cuantificar hasta qué punto disperso viñetas (valores de variables aleatorias) relativas al centro del objetivo ( expectativa matemática). bien y dispersión traducido del latín no es otra manera que dispersión .

Veamos cómo se determina esta característica numérica usando uno de los ejemplos de la primera parte de la lección:

Allí encontramos una expectativa matemática decepcionante de este juego, y ahora tenemos que calcular su varianza, que denotado por a través de .

Averigüemos hasta qué punto están “dispersas” las ganancias/pérdidas en relación con el valor medio. Obviamente, para esto necesitamos calcular diferencias entre valores de variables aleatorias y ella expectativa matemática:

–5 – (–0,5) = –4,5
2,5 – (–0,5) = 3
10 – (–0,5) = 10,5

Ahora parece que es necesario resumir los resultados, pero de esta manera no es adecuado, porque las fluctuaciones hacia la izquierda se anulan entre sí con las fluctuaciones hacia la derecha. Así, por ejemplo, un tirador "aficionado" (ejemplo arriba) las diferencias seran , y cuando se suman darán cero, por lo que no obtendremos ninguna estimación de la dispersión de sus disparos.

Para solucionar este problema puedes considerar módulos diferencias, pero por razones técnicas el enfoque se ha arraigado cuando se las eleva al cuadrado. Es más conveniente formular la solución en una tabla:

Y aquí pide calcular peso promedio el valor de las desviaciones al cuadrado. ¿Qué es? Es de ellos valor esperado, que es una medida de dispersión:

definición variaciones. De la definición se desprende inmediatamente que la varianza no puede ser negativa– ¡toma nota para practicar!

Recordemos cómo encontrar el valor esperado. Multiplica las diferencias al cuadrado por las probabilidades correspondientes. (Continuación de la tabla):
– en sentido figurado, esto es “fuerza de tracción”,
y resumir los resultados:

¿No crees que, comparado con las ganancias, el resultado resultó ser demasiado grande? Así es, lo elevamos al cuadrado y, para volver a la dimensión de nuestro juego, necesitamos extraer Raíz cuadrada. Esta cantidad se llama Desviación Estándar y se denota con la letra griega “sigma”:

Este valor a veces se llama Desviación Estándar .

¿Cuál es su significado? Si nos desviamos de la expectativa matemática hacia la izquierda y hacia la derecha por el promedio Desviación Estándar:

– entonces los valores más probables de la variable aleatoria estarán “concentrados” en este intervalo. Lo que realmente observamos:

Sin embargo, ocurre que al analizar la dispersión casi siempre se opera con el concepto de dispersión. Averigüemos qué significa en relación con los juegos. Si en el caso de las flechas estamos hablando de la "precisión" de los impactos en relación con el centro del objetivo, aquí la dispersión caracteriza dos cosas:

En primer lugar, es obvio que a medida que aumentan las apuestas, también aumenta la dispersión. Entonces, por ejemplo, si aumentamos 10 veces, entonces la expectativa matemática aumentará 10 veces y la varianza aumentará 100 veces. (ya que esta es una cantidad cuadrática). ¡Pero tenga en cuenta que las reglas del juego en sí no han cambiado! Sólo las apuestas han cambiado, en términos generales, antes apostamos 10 rublos, ahora son 100.

El segundo punto, más interesante, es que la variación caracteriza el estilo de juego. Fijar mentalmente las apuestas del juego en cierto nivel, y veamos qué es qué:

Un juego de varianza baja es un juego cauteloso. El jugador tiende a elegir los esquemas más fiables, en los que no pierde ni gana demasiado a la vez. Por ejemplo, el sistema rojo/negro en la ruleta. (ver ejemplo 4 del artículo Variables aleatorias) .

Juego de alta varianza. A ella la llaman a menudo dispersivo juego. Este es un estilo de juego aventurero o agresivo, donde el jugador elige esquemas de "adrenalina". Al menos recordemos "Martingala", en el que las cantidades en juego son órdenes de magnitud mayores que el juego “tranquilo” del punto anterior.

La situación en el póquer es indicativa: existen los llamados ajustado Jugadores que tienden a ser cautelosos e “inseguros” con sus fondos de juego. (financiar). No es sorprendente que sus fondos no fluctúen significativamente (baja varianza). Por el contrario, si un jugador tiene una varianza alta, entonces es un agresor. A menudo corre riesgos, hace grandes apuestas y puede arruinar un banco enorme o perderse en pedazos.

Lo mismo sucede en Forex y así sucesivamente; hay muchos ejemplos.

Además, en todos los casos no importa si el juego se juega por unos centavos o por miles de dólares. Cada nivel tiene sus jugadores de baja y alta dispersión. Bueno, como recordamos, el ganador promedio es “responsable” valor esperado.

Probablemente hayas notado que encontrar variaciones es un proceso largo y laborioso. Pero las matemáticas son generosas:

Fórmula para encontrar la varianza

Esta fórmula se deriva directamente de la definición de varianza y la ponemos en práctica de inmediato. Copiaré el letrero con nuestro juego de arriba:

y la expectativa matemática encontrada.

Calculemos la varianza de la segunda forma. Primero, encontremos la expectativa matemática: el cuadrado de la variable aleatoria. Por determinación de la expectativa matemática:

En este caso:

Así, según la fórmula:

Como dicen, siente la diferencia. Y en la práctica, por supuesto, es mejor utilizar la fórmula (a menos que la condición requiera lo contrario).

Dominamos la técnica de resolución y diseño:

Ejemplo 6

Encuentre su expectativa matemática, varianza y desviación estándar.

Esta tarea se encuentra en todas partes y, por regla general, carece de significado significativo.
Te puedes imaginar varias bombillas con números que se encienden en un manicomio con ciertas probabilidades :)

Solución: Es conveniente resumir los cálculos básicos en una tabla. Primero, escribimos los datos iniciales en las dos líneas superiores. Luego calculamos los productos, luego y finalmente las sumas en la columna de la derecha:

En realidad, casi todo está listo. La tercera línea muestra una expectativa matemática ya preparada: .

Calculamos la varianza usando la fórmula:

Y finalmente la desviación estándar:
– Personalmente suelo redondear a 2 decimales.

Todos los cálculos se pueden realizar en una calculadora o, mejor aún, en Excel:

Es difícil equivocarse aquí :)

Respuesta:

Quienes lo deseen pueden simplificar aún más su vida y aprovechar mi calculadora (manifestación), que no solo resolverá instantáneamente este problema, sino que también construirá gráficos temáticos (llegaremos allí pronto). El programa puede ser descargar de la biblioteca– si has descargado al menos uno material educativo, o conseguir de otra manera. ¡Gracias por apoyar el proyecto!

Un par de tareas para decisión independiente:

Ejemplo 7

Calcula la varianza de la variable aleatoria del ejemplo anterior por definición.

Y un ejemplo parecido:

Ejemplo 8

Una variable aleatoria discreta está especificada por su ley de distribución:

Sí, los valores de las variables aleatorias pueden ser bastante grandes. (ejemplo de trabajo real), y aquí, si es posible, utilice Excel. Como, por cierto, en el Ejemplo 7: es más rápido, más confiable y más divertido.

Soluciones y respuestas al final de la página.

Para concluir la segunda parte de la lección, veremos otro problema típico, incluso se podría decir un pequeño acertijo:

Ejemplo 9

Una variable aleatoria discreta sólo puede tomar dos valores: y, y. Se conocen la probabilidad, la expectativa matemática y la varianza.

Solución: Comencemos con una probabilidad desconocida. Como una variable aleatoria sólo puede tomar dos valores, la suma de las probabilidades de los eventos correspondientes es:

y desde entonces .

Sólo queda encontrar..., es fácil de decir :) Pero bueno, allá vamos. Por definición de expectativa matemática:
– sustituir cantidades conocidas:

– y no se puede extraer nada más de esta ecuación, excepto que puedes reescribirla en la dirección habitual:

o:

Creo que puedes adivinar los próximos pasos. Compongamos y resolvamos el sistema:

decimales- Esto, por supuesto, es una completa vergüenza; multiplica ambas ecuaciones por 10:

y dividir por 2:

Eso es mejor. De la 1ª ecuación expresamos:
(esta es la manera más fácil)– sustituir en la segunda ecuación:


Estamos construyendo al cuadrado y hacer simplificaciones:

Multiplicar por:

El resultado fue ecuación cuadrática, encontramos su discriminante:
- ¡Excelente!

y obtenemos dos soluciones:

1) si , Eso ;

2) si , Eso .

La condición se cumple con el primer par de valores. Es muy probable que todo sea correcto, pero, sin embargo, anotemos la ley de distribución:

y realice una verificación, es decir, encuentre la expectativa:

La teoría de la probabilidad es una rama especial de las matemáticas que estudian únicamente estudiantes de instituciones de educación superior. ¿Te gustan los cálculos y las fórmulas? ¿No le asusta la perspectiva de familiarizarse con la distribución normal, la entropía de conjunto, la expectativa matemática y la dispersión de una variable aleatoria discreta? Entonces este tema te resultará muy interesante. Conozcamos varios de los conceptos básicos más importantes de esta rama de la ciencia.

Recordemos lo básico.

Incluso si recuerdas más conceptos simples Teoría de la probabilidad, no descuides los primeros párrafos del artículo. La cuestión es que sin una comprensión clara de los conceptos básicos, no podrá trabajar con las fórmulas que se analizan a continuación.

Así que algo está pasando evento al azar, una especie de experimento. Como resultado de las acciones que realizamos, podemos obtener varios resultados: algunos de ellos ocurren con más frecuencia, otros con menos frecuencia. La probabilidad de un evento es la relación entre el número de resultados de un tipo realmente obtenidos y el número total de posibles. Sólo conociendo la definición clásica de este concepto se puede empezar a estudiar la expectativa matemática y la dispersión de variables aleatorias continuas.

Promedio

En la escuela, durante las lecciones de matemáticas, empezaste a trabajar con la media aritmética. Este concepto se utiliza ampliamente en la teoría de la probabilidad y, por lo tanto, no puede ignorarse. Lo principal para nosotros en este momento es que lo encontraremos en las fórmulas para la expectativa matemática y la dispersión de una variable aleatoria.

Tenemos una secuencia de números y queremos encontrar la media aritmética. Todo lo que se requiere de nosotros es sumar todo lo disponible y dividirlo por el número de elementos de la secuencia. Tengamos números del 1 al 9. La suma de los elementos será igual a 45, y dividiremos este valor entre 9. Respuesta: - 5.

Dispersión

En términos científicos, la dispersión es el cuadrado promedio de las desviaciones de los valores obtenidos de una característica de la media aritmética. Se denota con una letra latina mayúscula D. ¿Qué se necesita para calcularlo? Para cada elemento de la secuencia, calculamos la diferencia entre el número existente y la media aritmética y lo elevamos al cuadrado. Habrá exactamente tantos valores como resultados pueda haber para el evento que estamos considerando. A continuación, sumamos todo lo recibido y lo dividimos por la cantidad de elementos de la secuencia. Si tenemos cinco resultados posibles, entonces dividimos entre cinco.

La dispersión también tiene propiedades que deben recordarse para poder utilizarla al resolver problemas. Por ejemplo, cuando se aumenta una variable aleatoria X veces, la varianza aumenta X al cuadrado (es decir, X*X). ella nunca sucede menos que cero y no depende de cambiar los valores en un valor igual hacia arriba o hacia abajo. Además, para pruebas independientes la varianza de la suma es igual a la suma de las varianzas.

Ahora definitivamente necesitamos considerar ejemplos de la varianza de una variable aleatoria discreta y la expectativa matemática.

Digamos que realizamos 21 experimentos y obtuvimos 7 resultados diferentes. Observamos cada uno de ellos 1, 2, 2, 3, 4, 4 y 5 veces, respectivamente. ¿A qué será igual la varianza?

Primero, calculemos la media aritmética: la suma de los elementos, por supuesto, es 21. Divídalo por 7, obteniendo 3. Ahora reste 3 de cada número en la secuencia original, eleve cada valor al cuadrado y sume los resultados. El resultado es 12. Ahora todo lo que tenemos que hacer es dividir el número por el número de elementos y, al parecer, eso es todo. ¡Pero hay una trampa! Discutamoslo.

Dependencia del número de experimentos.

Resulta que al calcular la varianza, el denominador puede contener uno de dos números: N o N-1. Aquí N es el número de experimentos realizados o el número de elementos en la secuencia (que es esencialmente lo mismo). ¿De qué depende esto?

Si el número de pruebas se mide en centenas, entonces debemos poner N en el denominador. Si está en unidades, entonces N-1. Los científicos decidieron dibujar la frontera de manera bastante simbólica: hoy pasa por el número 30. Si realizamos menos de 30 experimentos, dividimos la cantidad entre N-1, y si son más, entre N.

Tarea

Volvamos a nuestro ejemplo de resolución del problema de varianza y expectativa matemática. Obtuvimos un número intermedio 12, que debía dividirse por N o N-1. Como realizamos 21 experimentos, que son menos de 30, elegiremos la segunda opción. Entonces la respuesta es: la varianza es 12/2 = 2.

Valor esperado

Pasemos al segundo concepto, que debemos considerar en este artículo. La expectativa matemática es el resultado de sumar todos los resultados posibles multiplicados por las probabilidades correspondientes. Es importante entender que el valor obtenido, así como el resultado del cálculo de la varianza, se obtiene una sola vez para todo el problema, sin importar cuántos resultados se consideren en él.

La fórmula para la expectativa matemática es bastante simple: tomamos el resultado, lo multiplicamos por su probabilidad, sumamos lo mismo para el segundo, tercer resultado, etc. Todo lo relacionado con este concepto no es difícil de calcular. Por ejemplo, la suma de los valores esperados es igual al valor esperado de la suma. Lo mismo ocurre con el trabajo. No todas las cantidades de la teoría de la probabilidad permiten realizar operaciones tan simples. Tomemos el problema y calculemos el significado de dos conceptos que hemos estudiado a la vez. Además, estábamos distraídos por la teoría: es hora de practicar.

Un ejemplo más

Realizamos 50 ensayos y obtuvimos 10 tipos de resultados (números del 0 al 9) que aparecen en diferentes porcentajes. Estos son, respectivamente: 2%, 10%, 4%, 14%, 2%, 18%, 6%, 16%, 10%, 18%. Recuerde que para obtener probabilidades es necesario dividir los valores porcentuales entre 100. Así, obtenemos 0,02; 0,1, etc. Presentemos un ejemplo de resolución del problema de la varianza de una variable aleatoria y la expectativa matemática.

Calculamos la media aritmética mediante la fórmula que recordamos de la escuela primaria: 50/10 = 5.

Ahora conviertamos las probabilidades en el número de resultados "en partes" para que sea más fácil de contar. Obtenemos 1, 5, 2, 7, 1, 9, 3, 8, 5 y 9. De cada valor obtenido restamos la media aritmética, tras lo cual elevamos al cuadrado cada uno de los resultados obtenidos. Vea cómo hacer esto usando el primer elemento como ejemplo: 1 - 5 = (-4). Siguiente: (-4) * (-4) = 16. Para otros valores, realice estas operaciones usted mismo. Si hiciste todo correctamente, luego de sumarlos todos obtendrás 90.

Sigamos calculando la varianza y el valor esperado dividiendo 90 entre N. ¿Por qué elegimos N en lugar de N-1? Correcto, porque el número de experimentos realizados supera los 30. Entonces: 90/10 = 9. Obtuvimos la varianza. Si obtiene un número diferente, no se desespere. Lo más probable es que haya cometido un simple error en los cálculos. Vuelva a verificar lo que escribió y probablemente todo encajará.

Finalmente, recuerde la fórmula de la expectativa matemática. No daremos todos los cálculos, solo escribiremos una respuesta que podrá consultar después de completar todos los procedimientos requeridos. El valor esperado será 5,48. Recordemos únicamente cómo realizar las operaciones, tomando como ejemplo los primeros elementos: 0*0.02 + 1*0.1... y así sucesivamente. Como puede ver, simplemente multiplicamos el valor del resultado por su probabilidad.

Desviación

Otro concepto muy relacionado con la dispersión y la expectativa matemática es la desviación estándar. Se denota con las letras latinas sd o con la minúscula griega "sigma". Este concepto muestra cuánto se desvían en promedio los valores de característica central. Para encontrar su valor, necesitas calcular la raíz cuadrada de la varianza.

Si traza un gráfico de distribución normal y desea ver la desviación al cuadrado directamente en él, esto se puede hacer en varias etapas. Tome la mitad de la imagen a la izquierda o derecha del modo (valor central), dibuje una perpendicular al eje horizontal para que las áreas de las figuras resultantes sean iguales. El tamaño del segmento entre el centro de la distribución y la proyección resultante sobre el eje horizontal representará la desviación estándar.

Software

Como puede verse en las descripciones de las fórmulas y los ejemplos presentados, calcular la varianza y la expectativa matemática no es el procedimiento más simple desde un punto de vista aritmético. Para no perder el tiempo, tiene sentido utilizar el programa utilizado en la educación superior. Instituciones educacionales- se llama "R". Tiene funciones que te permiten calcular valores para muchos conceptos de estadística y teoría de probabilidad.

Por ejemplo, especifica un vector de valores. Esto se hace de la siguiente manera: vector<-c(1,5,2…). Теперь, когда вам потребуется посчитать какие-либо значения для этого вектора, вы пишете функцию и задаете его в качестве аргумента. Для нахождения дисперсии вам нужно будет использовать функцию var. Пример её использования: var(vector). Далее вы просто нажимаете «ввод» и получаете результат.

Finalmente

La dispersión y la expectativa matemática son las condiciones sin las cuales es difícil calcular algo en el futuro. En el curso principal de conferencias en las universidades, se discuten ya en los primeros meses de estudio de la materia. Precisamente por la falta de comprensión de estos conceptos simples y la imposibilidad de calcularlos, muchos estudiantes inmediatamente comienzan a retrasarse en el programa y luego obtienen malas calificaciones al final de la sesión, lo que los priva de becas.

Practica durante al menos una semana, media hora diaria, resolviendo tareas similares a las que se presentan en este artículo. Luego, en cualquier prueba de teoría de la probabilidad, podrá afrontar los ejemplos sin consejos superfluos ni hojas de trucos.

Esta página describe un ejemplo estándar de búsqueda de varianza; también puede consultar otros problemas para encontrarla.

Ejemplo 1. Determinación de varianza grupal, media grupal, intergrupal y total

Ejemplo 2. Encontrar la varianza y el coeficiente de variación en una tabla de agrupación

Ejemplo 3. Encontrar la varianza en una serie discreta

Ejemplo 4. Los siguientes datos están disponibles para un grupo de 20 estudiantes por correspondencia. Es necesario construir una serie de intervalos de la distribución de la característica, calcular el valor promedio de la característica y estudiar su dispersión.

Construyamos una agrupación de intervalos. Determinemos el rango del intervalo usando la fórmula:

donde X max es el valor máximo de la característica de agrupación;
X min – valor mínimo de la característica de agrupación;
n – número de intervalos:

Aceptamos n=5. El paso es: h = (192 - 159)/ 5 = 6,6

Creemos una agrupación de intervalos.

Para más cálculos, construiremos una tabla auxiliar:

X"i – la mitad del intervalo. (por ejemplo, la mitad del intervalo 159 – 165,6 = 162,3)

Determinamos la altura promedio de los estudiantes utilizando la fórmula del promedio aritmético ponderado:

Determinemos la varianza usando la fórmula:

La fórmula se puede transformar así:

De esta fórmula se deduce que la varianza es igual a la diferencia entre el promedio de los cuadrados de las opciones y el cuadrado y el promedio.

Dispersión en series de variación. con intervalos iguales usando el método de los momentos se puede calcular de la siguiente manera usando la segunda propiedad de dispersión (dividiendo todas las opciones por el valor del intervalo). Determinando la varianza, calculado mediante el método de los momentos, utilizando la siguiente fórmula es menos laborioso:

donde i es el valor del intervalo;
A es un cero convencional, para lo cual conviene utilizar la mitad del intervalo de mayor frecuencia;
m1 es el cuadrado del momento de primer orden;
m2 - momento de segundo orden

Variación de rasgos alternativos (si en una población estadística una característica cambia de tal manera que solo hay dos opciones mutuamente excluyentes, entonces dicha variabilidad se llama alternativa) se puede calcular mediante la fórmula:

Sustituyendo q = 1- p en esta fórmula de dispersión, obtenemos:

Tipos de variación

varianza total Mide la variación de una característica en toda la población bajo la influencia de todos los factores que causan esta variación. Es igual al cuadrado medio de las desviaciones de los valores individuales de una característica x del valor medio general de x y puede definirse como varianza simple o varianza ponderada.

Variación dentro del grupo caracteriza la variación aleatoria, es decir Parte de la variación se debe a la influencia de factores no contabilizados y no depende del factor-atributo que forma la base del grupo. Dicha dispersión es igual al cuadrado medio de las desviaciones de los valores individuales del atributo dentro del grupo X de la media aritmética del grupo y puede calcularse como dispersión simple o como dispersión ponderada.



De este modo, medidas de varianza dentro del grupo variación de un rasgo dentro de un grupo y está determinada por la fórmula:

donde xi es el promedio del grupo;
ni es el número de unidades del grupo.

Por ejemplo, las variaciones intragrupo que es necesario determinar en la tarea de estudiar la influencia de las calificaciones de los trabajadores en el nivel de productividad laboral en un taller muestran variaciones en la producción en cada grupo causadas por todos los factores posibles (estado técnico del equipo, disponibilidad de herramientas y materiales, edad de los trabajadores, intensidad laboral, etc.), salvo diferencias en la categoría de cualificación (dentro de un grupo todos los trabajadores tienen las mismas cualificaciones).

2024 ongun.ru
Enciclopedia sobre calefacción, suministro de gas, alcantarillado.