Conceptos Fundamentales de Estadística Descriptiva e Inferencial

Definiciones Básicas

Estadística: Ciencia que establece métodos para la recopilación, ordenación, análisis e interpretación de datos.

Estadística Descriptiva: Analiza datos recolectados para describir, resumir y presentar su comportamiento.

Estadística Inferencial: Trata con técnicas que permiten inferir acerca de un parámetro de una población a partir de una muestra.

Población: Conjunto completo de individuos, objetos o datos a explorar. Puede ser finita o infinita.

Muestra: Subconjunto de mediciones seleccionada de la población.

Estadístico: Número calculado a partir de los datos de la muestra que cuantifica una característica de ella.

Parámetro: Número calculado sobre los datos de una población que cuantifica una característica de ella.

Datos: Son el resultado de las mediciones y son información numérica necesaria.

  • Datos cuantitativos: Resultado de un proceso que cuenta o mide.
    • Datos discretos: Respuestas numéricas que surgen de un proceso de conteo.
    • Datos continuos: Respuestas numéricas que surgen de un proceso de medición.
  • Datos cualitativos: Resultado de un proceso que categoriza o describe un elemento de una población.

Tipos de Escala de Medición

  • Nominal: Los números solo se emplean para diferenciar los objetos en distintas categorías o cuando se emplean nombres.
  • Ordinal: Los números se utilizan para diferenciar un orden de supremacía de acuerdo con cierto criterio jerárquico.
  • De Intervalos: Permite ordenar las mediciones y decir también en cuánto difiere una situación de otra (1 unidad de medida y un origen (0) arbitrario).
  • De razón: Posee una unidad de medida y un punto de origen no arbitrario (0 verdadero).

Organización y Presentación de Datos

Tabla de Frecuencias: Agrupación de datos cualitativos en clases mutuamente excluyentes que muestran el número de observaciones en cada clase.

  • Ordenamiento de datos cuantitativos: Ascendente o descendente.

Distribución de Frecuencias: Representación estructurada en forma de tabla de toda la información que se ha recogido sobre la variable que se estudia.

Frecuencia: Número de veces que aparece un valor X en una muestra.

Frecuencia Acumulada: Se obtiene sumando todas las frecuencias correspondientes a los valores de la muestra que son menores o iguales a X.

Frecuencia Relativa: Se obtiene dividiendo la frecuencia entre el tamaño n de la muestra.

Frecuencia Relativa Acumulada: División de la frecuencia acumulada entre el tamaño de la muestra.

Clases: Grupos de valores que describen una característica de los datos.

Marca de clase: Puntos medios de la clase.

Amplitud de clase: Diferencia entre los dos límites de clase superiores consecutivos o entre dos límites de clase inferiores consecutivos.

Variables y sus Tipos

Variable: Cualquier propiedad o característica de algún evento, objeto o persona que puede tener diferentes valores según las condiciones.

Variable Continua: Aquella que teóricamente puede asumir un número infinito de valores entre las unidades adyacentes de una escala.

Variable Discreta: Aquella para la cual no existen valores posibles entre las unidades adyacentes de una escala.

Límites Reales de una Variable Continua: Son aquellos valores que están por arriba y por debajo de los valores registrados.

Medidas de Tendencia Central y Dispersión

Tendencia Central: Punto medio de una distribución (medidas de posición).

Dispersión: Extensión de los datos en una distribución de frecuencias.

Sesgo: Las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas.

Curvas Simétricas: Tienen una forma tal que una línea vertical que pase por el punto más alto de la curva la divide en dos partes iguales.

Media Aritmética (Promedio): Valor que se calcula al promediar un conjunto de datos.

Mediana: Punto situado a la mitad del conjunto de datos, dividiendo el conjunto en dos partes iguales.

Moda: Valor que más a menudo se repite y es el punto más alto de la curva de distribución.

Alcance o Rango: Diferencia entre el valor más alto y el más pequeño.

Medidas de Variación o Dispersión: Describen cómo se dispersan o distribuyen las observaciones de un conjunto de datos.

Varianza: Medida de la distancia, cuadrado promedio, entre la media y cada observación de la población.

Desviación Estándar: Es la raíz cuadrada de la varianza de la población.

Teorema de Chebyshev: Permite determinar dónde están localizados los valores de una distribución de frecuencias con relación a la media.

Coeficiente de Variación: Medida relativa de la dispersión. Expresa la desviación estándar como porcentaje de la media.

Medidas de Posición: Cuartiles, Deciles y Percentiles

Cuartiles: Valores que dividen una sucesión de datos ordenados en cuatro partes iguales.

Deciles: Valores que dividen la sucesión de datos ordenados en diez partes iguales.

Percentiles: Valores que dividen la sucesión de datos ordenados en cien partes iguales.