Conceptos Fundamentales de Estadística
Varianza: Propiedades
La varianza de una variable aleatoria es una medida de la dispersión de la distribución de probabilidad de esta.
Distribución Binomial
Experimento de Bernoulli
Experimento aleatorio con dos resultados posibles: éxito y fracaso, con probabilidades respectivas p y q: 1-p.
X: número de éxitos en los n ensayos – b (n,p)
Función de Probabilidad de X
1. Probabilidad de obtener, en n ensayos independientes, r éxitos consecutivos seguidos de n-r fracasos consecutivos.
2. Probabilidad de obtener r éxitos y n-r fracasos en n ensayos independientes.
3. Número de formas posibles de obtener r éxitos y n-r fracasos en n ensayos.
Características de la Distribución Binomial
1. Media o esperanza matemática: E(x) = np
2. Varianza V(x) = npq
3. Reproducibilidad: si X e Y son dos variables aleatorias independientes con distribuciones respectivas b(n(1),p) y b(n(2),p) entonces X+Y —- b(n1+n2,p).
Distribución de Poisson
La distribución de Poisson se emplea para aproximar la función de probabilidad binomial cuando n es grande y p pequeña.
Características de la Distribución de Poisson
1. Media o esperanza matemática E(x) = λ
2. Varianza V(x) = λ
3. Reproducibilidad
Teorema Central del Límite
Sean X(1), X(2),…., X(n) n variables aleatorias independientes e idénticamente distribuidas con una distribución de probabilidad no especificada y con una media μ y una desviación típica σ. Entonces la variable aleatoria X(1) + X(2) + … + X(n) tiene una distribución con media μn y desviación típica σ√n que tiende hacia una distribución normal conforme n tiende a infinito.
Tipos de Muestreo Estadístico
Muestreo Aleatorio Simple (o Muestreo Aleatorio con Reemplazamiento)
Cada elemento de la población tiene la misma probabilidad de ser seleccionado en cada extracción, siendo estas extracciones independientes entre sí.
Muestreo Aleatorio sin Reemplazamiento
Cada elemento tiene la misma probabilidad de ser seleccionado en cada extracción, aunque si es seleccionado en una extracción queda excluido en las siguientes.
Muestreo Estratificado
Se consideran dos o más subpoblaciones (estratos) lo más homogéneas posibles, en cada uno de estos estratos se seleccionan, mediante muestreo aleatorio simple, un número de elementos fijado previamente para cada estrato.
Muestreo por Conglomerados
Se divide a la población en áreas o zonas de muestreo (conglomerados) lo más heterogéneas posibles, a continuación, se seleccionan algunos conglomerados sobre los que se realiza un muestreo aleatorio simple.
Muestreo Sistemático
Sobre una población de n elementos ordenados según una determinada característica, se van seleccionando elementos de k en k, a partir de un valor de orden inicial r menor que k, hasta agotar los n.
Definición de Estadístico y Distribución Muestral
Muestra aleatoria simple (m.a.s.) de tamaño n: vector (x(1), x(2),…., x(n)), de n variables aleatorias independientes que tiene la misma función de probabilidad que la característica x estudiada en la población.
Estadístico
Cualquier función de las variables aleatorias que se observaron en la muestra.
Distribución Muestral
Distribución de probabilidad de un estadístico.
Definiciones Preliminares: Estimación y Contraste de Hipótesis
La Estimación
Se encarga de la realización de afirmaciones acerca de los parámetros de la población en estudio, basándose en la información proporcionada por la muestra. La estimación puede realizarse mediante un valor único (estimación puntual) o a través de un intervalo de valores (estimación por intervalo de confianza).
El Contraste de Hipótesis
Se ocupa de verificar alguna afirmación sobre la población en estudio, determinando si la información proporcionada por la muestra resulta coherente o no con la hipótesis establecida. El contraste de hipótesis se puede abordar mediante:
Estadística Paramétrica
Conjunto de técnicas desarrolladas sobre la base de que la muestra procede de una población con una determinada distribución de probabilidad, generalmente normal.
Estadística no Paramétrica
Conjunto de técnicas que o bien no requieren ninguna hipótesis previa acerca de la distribución de probabilidad de la población o bien utilizan estadísticos con una distribución de probabilidad independiente de la población.
Estimador Puntual
Estadístico usado para aproximar o estimar un parámetro poblacional θ.
Estimación Puntual
Valor numérico del estimador puntual en una muestra concreta.
Hipótesis Nula e Hipótesis Alternativa
En el contraste de hipótesis, se tiene una noción preconcebida acerca del valor real de un parámetro de la población sometida a estudio. Esto implica que participan dos teorías o hipótesis en un problema de este tipo: la hipótesis que propone el experimentador (hipótesis de investigación o hipótesis alternativa, H(1)) y la negación de esa hipótesis (hipótesis nula, H(0)).
Estadístico de Contraste
Estadístico cuya distribución de probabilidad, bajo el supuesto de que H(0) es cierta, es conocida.
Región Crítica. Contrastes Bilaterales y Unilaterales
La región crítica es el conjunto de valores del estadístico de contraste que llevan a la decisión de rechazar H(0). Si la región crítica está formada por dos conjuntos disjuntos de puntos: contraste bilateral. Si la región crítica está formada por un solo conjunto de puntos: contraste unilateral.
El Valor p
El nivel crítico o valor p de una prueba es el nivel de significación menor para el cual el valor observado del estadístico de contraste es significativo (conduce al rechazo de H(0)), con otras palabras, es la probabilidad de observar, bajo el supuesto de que H(0) es cierta, un valor del estadístico de contraste que sea por lo menos tan extremo como el valor observado en el experimento realizado.
Interpretación del Valor p
Si p es menor o igual que α se rechaza la hipótesis nula empleando un nivel de significación igual a α.
Si p es mayor que α, no se rechaza la hipótesis nula empleando un nivel de significación α.
Etapas en el Contraste de Hipótesis
1. Identificar el parámetro de interés.
2. Formular la hipótesis nula y alternativa.
3. Fijar α (0.05 o 0.01).
4. Seleccionar el estadístico de contraste adecuado.
5. Determinar la región crítica (RC).
6. Calcular el valor observado del estadístico de contraste (EC).
7. Establecer la conclusión.
Concepto de Error de Medida
Ya que medidas repetidas proporcionan resultados diferentes, la variación en la medida provoca que exista una diferencia en un valor medido de una cierta cantidad (x) y su valor verdadero (v).
Tipos de Errores
Errores Groseros
Son el resultado de equivocaciones debidas a la falta de cuidado del observador.
Errores Sistemáticos
Son errores debidos a una o pocas causas definidas que actúan según una ley determinada en una dirección determinada. Los distintos resultados los alteran en una cantidad constante.
Errores Aleatorios
Son todos los demás errores que no muestran regularidades o cuyas regularidades no se conocen.
Concepto de Ajuste
Las relaciones generales que conectan las medidas realizadas con otras cantidades de interés constituyen el modelo. Cada observación que se haga en exceso de n(0) se llama medida redundante, cada subconjunto de tamaño n(0) de las n medidas dará una determinación distinta del modelo. Esta inconsistencia se resuelve reemplazando las observaciones realizadas por otro conjunto, llamado estimaciones, tal que este conjunto determine el modelo exactamente. Cada observación estimada l(i) puede considerarse como una observación corregida, obtenida a partir del valor observado l(i) sumado a una corrección o residuo v(i). Los residuos deben calcularse. La operación consistente en hallar estos residuos y, a partir de ellos, el conjunto de estimaciones se llama ajuste.
Ecuaciones de Condición
Las relaciones que deben satisfacer las observaciones ajustadas de modo que se satisfaga el modelo pueden expresarse en forma matricial.