Estadística y Probabilidad: Fundamentos Clave
Estadística Descriptiva de una Variable
- *fi*: Frecuencia absoluta de *xi*, número de veces que aparece repetido *xi*.
- *hi*: Frecuencia relativa de *xi*, frecuencia absoluta de *xi* expresada en tanto por uno. *hi* = *fi*/*n*.
- *Fi*: Frecuencia absoluta acumulada de *xi*, número de veces que aparecen valores menores o iguales a *xi*.
- *Hi*: Frecuencia relativa acumulada de *xi*, frecuencia absoluta acumulada de *xi* expresada en tanto por uno. *Hi* = *Fi*/*n*.
Tablas de Frecuencias con Datos Agrupados en Intervalos
- *Ii*, *Si*: Límites inferior y superior del intervalo o fronteras de clase.
- *xi*: Marca de clase: Valor representativo del intervalo *xi* = (*Ii* + *Si*)/2.
- *ci*: Amplitud de clase, longitud del intervalo *ci* = *Si* – *Ii*.
- El número de intervalos o clases empleado para clasificar los datos depende del número de observaciones, 5 ≤ K ≤ 15.
- Los intervalos deben ser exhaustivos y mutuamente excluyentes.
- Siempre que se pueda, deben crearse intervalos de igual amplitud.
Representación Gráfica de los Datos
- Gráficas para una característica cualitativa: diagrama de sectores y diagrama de barras.
- Gráficas para una característica cuantitativa con los datos sin agrupar en intervalos: polígono de frecuencias y polígono de frecuencias acumuladas.
- Gráficas para una característica cuantitativa con los datos agrupados en intervalos de clase: histograma de frecuencias e histogramas de frecuencias acumuladas.
Resumen de los Datos
Medidas de Posición o Localización
Tienen por objeto describir cómo se va distribuyendo una variable a lo largo del conjunto de sus posibles valores.
Medidas de Tendencia Central o de Centralización
Determinan un centro de referencia para el conjunto completo de datos.
- Media: Si las observaciones de una muestra de tamaño *n* son *x1*, *x2*,…, *xn*, entonces la media es *x̄* = (*x1* + *x2* + … + *xn*)/ *n*; si los datos están expresados en una tabla de frecuencias *x̄* = (*x1f1* + *x2f2* + … + *xkfk*)/ *n*; el valor de la media puede afectarse desproporcionadamente por la existencia de algunos valores extremos.
- Mediana: Es el valor numérico que divide a la serie ordenada de datos en dos partes iguales, cada una con el 50% de las observaciones: si *n* es impar, *Me* = *x(n+1)/2*; si *n* es par, *Me* = {*x(n/2)* + *x([(n/2)]+1)*}/2; si los datos están agrupados en intervalos de clase *Me* = *Ii* + [(*n*/2 – *Fi-1*)/ *fi*] * ci*.
- Moda: Es el valor de la variable que se presenta con mayor frecuencia, si los datos están agrupados en intervalos de clase con la misma amplitud *Mo* = *Ii* + [(*fi* – *fi-1*)/(*fi* – *fi-1* + *fi* – *fi+1*)] * *ci*; si la amplitud de los intervalos fuera desigual, *Mo* = *Ii* + [(*ki* – *ki-1*)/(*ki* – *ki-1* + *ki* – *ki+1*)] * *ci*.
Otras Medidas de Posición
Los cuartiles (*Q1*, *Q2*, *Q3*) son los valores que dividen a la serie ordenada de datos en cuatro partes iguales. Los percentiles (*P1*, *P2*,…, *P99*) son los valores que dividen a la serie ordenada de datos en cien partes iguales.
Teoría de la Probabilidad
La teoría de probabilidad es la rama de las matemáticas que describe y estudia el comportamiento aleatorio. Un experimento o fenómeno es aleatorio si no se puede predecir un resultado particular. Un hecho importante es que el comportamiento del azar es imprescindible con pocas repeticiones, pero presenta un comportamiento regular y predecible con muchas repeticiones. Aleatorio se refiere a una clase de orden que únicamente aparece después de muchas repeticiones. La idea de probabilidad es empírica, se basa más en la experiencia que en la teoría, ya que describe lo que ocurre después de muchos ensayos. El espacio muestral Ω de un fenómeno aleatorio es el conjunto de todos sus resultados posibles. Un suceso es cualquier resultado o conjunto de resultados de un fenómeno aleatorio. Un suceso ocurre si el resultado del experimento aleatorio es uno de los incluidos en él. El conjunto vacío Ø, suceso que no contiene a ningún resultado del espacio muestral, es un suceso que no ocurre nunca, por lo que se le llama suceso imposible. El espacio muestral, suceso en sí mismo, es un suceso que ocurre siempre, por lo que se le llama suceso seguro.
Operaciones entre Sucesos
La unión de dos sucesos A y B (A∪B) es el suceso formado por los resultados que pertenecen ya sea a A, a B o a ambos. La intersección de dos sucesos A y B es el suceso formado por los resultados que pertenecen tanto a A como a B. Dos sucesos son disjuntos (incompatibles o mutuamente excluyentes) si no tienen resultados en común. La diferencia de dos sucesos A y B (A-B) es el suceso formado por los resultados de A que no pertenecen a B.
Concepto de Probabilidad
Es un número real que mide la posibilidad de que ocurra tal suceso cuando el experimento aleatorio se lleve a cabo. La probabilidad de un suceso es la proporción de veces que ocurre ese suceso después de una serie de repeticiones del experimento.
Axiomas de la Probabilidad
Cualquier probabilidad es un número entre 0 y 1; esto es, para cualquier suceso. Si dos sucesos no tienen resultados en común, la probabilidad de que ocurra alguno de los dos es la suma de sus respectivas probabilidades.
Propiedades de la Probabilidad
- La probabilidad de que un suceso no ocurra es 1 menos la probabilidad de que este suceso ocurra: P(A∪B) = P(A) + P(B) – P(A∩B).
- La probabilidad del suceso diferencia A-B se calcula como: P(A-B) = P(A) – P(A∩B) siendo ∩ la intersección.
Regla de Laplace
Si un espacio muestral contiene N resultados igualmente probables, la probabilidad de cada resultado es 1/N. Si A es un suceso que contiene k resultados, entonces P(A) = k/N.