Varianza: Propiedades

La varianza de una variable aleatoria es una medida de la dispersión de la distribución de probabilidad de esta.

Distribución Binomial

Experimento de Bernoulli

Experimento aleatorio con dos resultados posibles: éxito y fracaso, con probabilidades respectivas p y q: 1-p.
X: número de éxitos en los n ensayos – b (n,p)

Función de Probabilidad de X

1. Probabilidad de obtener, en n ensayos independientes, r éxitos consecutivos seguidos de n-r fracasos consecutivos.
2. Probabilidad de obtener r éxitos y n-r fracasos en n ensayos independientes.
3. Número de formas posibles de obtener r éxitos y n-r fracasos en n ensayos.

Características de la Distribución Binomial

1. Media o esperanza matemática: E(x) = np
2. Varianza V(x) = npq
3. Reproducibilidad: si X e Y son dos variables aleatorias independientes con distribuciones respectivas b(n(1),p) y b(n(2),p) entonces X+Y —- b(n1+n2,p).

Distribución de Poisson

La distribución de Poisson se emplea para aproximar la función de probabilidad binomial cuando n es grande y p pequeña.

Características de la Distribución de Poisson

1. Media o esperanza matemática E(x) = λ
2. Varianza V(x) = λ
3. Reproducibilidad

Teorema Central del Límite

Sean X(1), X(2),…., X(n) n variables aleatorias independientes e idénticamente distribuidas con una distribución de probabilidad no especificada y con una media μ y una desviación típica σ. Entonces la variable aleatoria X(1) + X(2) + … + X(n) tiene una distribución con media μn y desviación típica σ√n que tiende hacia una distribución normal conforme n tiende a infinito.

Tipos de Muestreo Estadístico

Muestreo Aleatorio Simple (o Muestreo Aleatorio con Reemplazamiento)

Cada elemento de la población tiene la misma probabilidad de ser seleccionado en cada extracción, siendo estas extracciones independientes entre sí.

Muestreo Aleatorio sin Reemplazamiento

Cada elemento tiene la misma probabilidad de ser seleccionado en cada extracción, aunque si es seleccionado en una extracción queda excluido en las siguientes.

Muestreo Estratificado

Se consideran dos o más subpoblaciones (estratos) lo más homogéneas posibles, en cada uno de estos estratos se seleccionan, mediante muestreo aleatorio simple, un número de elementos fijado previamente para cada estrato.

Muestreo por Conglomerados

Se divide a la población en áreas o zonas de muestreo (conglomerados) lo más heterogéneas posibles, a continuación, se seleccionan algunos conglomerados sobre los que se realiza un muestreo aleatorio simple.

Muestreo Sistemático

Sobre una población de n elementos ordenados según una determinada característica, se van seleccionando elementos de k en k, a partir de un valor de orden inicial r menor que k, hasta agotar los n.

Definición de Estadístico y Distribución Muestral

Muestra aleatoria simple (m.a.s.) de tamaño n: vector (x(1), x(2),…., x(n)), de n variables aleatorias independientes que tiene la misma función de probabilidad que la característica x estudiada en la población.

Estadístico

Cualquier función de las variables aleatorias que se observaron en la muestra.

Distribución Muestral

Distribución de probabilidad de un estadístico.

Definiciones Preliminares: Estimación y Contraste de Hipótesis

La Estimación

Se encarga de la realización de afirmaciones acerca de los parámetros de la población en estudio, basándose en la información proporcionada por la muestra. La estimación puede realizarse mediante un valor único (estimación puntual) o a través de un intervalo de valores (estimación por intervalo de confianza).

El Contraste de Hipótesis

Se ocupa de verificar alguna afirmación sobre la población en estudio, determinando si la información proporcionada por la muestra resulta coherente o no con la hipótesis establecida. El contraste de hipótesis se puede abordar mediante:

Estadística Paramétrica

Conjunto de técnicas desarrolladas sobre la base de que la muestra procede de una población con una determinada distribución de probabilidad, generalmente normal.

Estadística no Paramétrica

Conjunto de técnicas que o bien no requieren ninguna hipótesis previa acerca de la distribución de probabilidad de la población o bien utilizan estadísticos con una distribución de probabilidad independiente de la población.

Estimador Puntual

Estadístico usado para aproximar o estimar un parámetro poblacional θ.

Estimación Puntual

Valor numérico del estimador puntual en una muestra concreta.

Hipótesis Nula e Hipótesis Alternativa

En el contraste de hipótesis, se tiene una noción preconcebida acerca del valor real de un parámetro de la población sometida a estudio. Esto implica que participan dos teorías o hipótesis en un problema de este tipo: la hipótesis que propone el experimentador (hipótesis de investigación o hipótesis alternativa, H(1)) y la negación de esa hipótesis (hipótesis nula, H(0)).

Estadístico de Contraste

Estadístico cuya distribución de probabilidad, bajo el supuesto de que H(0) es cierta, es conocida.

Región Crítica. Contrastes Bilaterales y Unilaterales

La región crítica es el conjunto de valores del estadístico de contraste que llevan a la decisión de rechazar H(0). Si la región crítica está formada por dos conjuntos disjuntos de puntos: contraste bilateral. Si la región crítica está formada por un solo conjunto de puntos: contraste unilateral.

El Valor p

El nivel crítico o valor p de una prueba es el nivel de significación menor para el cual el valor observado del estadístico de contraste es significativo (conduce al rechazo de H(0)), con otras palabras, es la probabilidad de observar, bajo el supuesto de que H(0) es cierta, un valor del estadístico de contraste que sea por lo menos tan extremo como el valor observado en el experimento realizado.

Interpretación del Valor p

Si p es menor o igual que α se rechaza la hipótesis nula empleando un nivel de significación igual a α.
Si p es mayor que α, no se rechaza la hipótesis nula empleando un nivel de significación α.

Etapas en el Contraste de Hipótesis

1. Identificar el parámetro de interés.
2. Formular la hipótesis nula y alternativa.
3. Fijar α (0.05 o 0.01).
4. Seleccionar el estadístico de contraste adecuado.
5. Determinar la región crítica (RC).
6. Calcular el valor observado del estadístico de contraste (EC).
7. Establecer la conclusión.

Concepto de Error de Medida

Ya que medidas repetidas proporcionan resultados diferentes, la variación en la medida provoca que exista una diferencia en un valor medido de una cierta cantidad (x) y su valor verdadero (v).

Tipos de Errores

Errores Groseros

Son el resultado de equivocaciones debidas a la falta de cuidado del observador.

Errores Sistemáticos

Son errores debidos a una o pocas causas definidas que actúan según una ley determinada en una dirección determinada. Los distintos resultados los alteran en una cantidad constante.

Errores Aleatorios

Son todos los demás errores que no muestran regularidades o cuyas regularidades no se conocen.

Concepto de Ajuste

Las relaciones generales que conectan las medidas realizadas con otras cantidades de interés constituyen el modelo. Cada observación que se haga en exceso de n(0) se llama medida redundante, cada subconjunto de tamaño n(0) de las n medidas dará una determinación distinta del modelo. Esta inconsistencia se resuelve reemplazando las observaciones realizadas por otro conjunto, llamado estimaciones, tal que este conjunto determine el modelo exactamente. Cada observación estimada l(i) puede considerarse como una observación corregida, obtenida a partir del valor observado l(i) sumado a una corrección o residuo v(i). Los residuos deben calcularse. La operación consistente en hallar estos residuos y, a partir de ellos, el conjunto de estimaciones se llama ajuste.

Ecuaciones de Condición

Las relaciones que deben satisfacer las observaciones ajustadas de modo que se satisfaga el modelo pueden expresarse en forma matricial.