Conceptos Fundamentales de Estadística Descriptiva e Inferencial: Una Introducción Completa
Conceptos Fundamentales de Estadística Descriptiva e Inferencial
Definiciones Básicas
Estadística: Ciencia que establece métodos para la recopilación, ordenación, análisis e interpretación de datos.
Estadística Descriptiva: Analiza datos recolectados para describir, resumir y presentar su comportamiento.
Estadística Inferencial: Trata con técnicas que permiten inferir acerca de un parámetro de una población a partir de una muestra.
Población: Conjunto completo de individuos, objetos o datos a explorar. Puede ser finita o infinita.
Muestra: Subconjunto de mediciones seleccionada de la población.
Estadístico: Número calculado a partir de los datos de la muestra que cuantifica una característica de ella.
Parámetro: Número calculado sobre los datos de una población que cuantifica una característica de ella.
Datos: Son el resultado de las mediciones y son información numérica necesaria.
- Datos cuantitativos: Resultado de un proceso que cuenta o mide.
- Datos discretos: Respuestas numéricas que surgen de un proceso de conteo.
- Datos continuos: Respuestas numéricas que surgen de un proceso de medición.
- Datos cualitativos: Resultado de un proceso que categoriza o describe un elemento de una población.
Tipos de Escala de Medición
- Nominal: Los números solo se emplean para diferenciar los objetos en distintas categorías o cuando se emplean nombres.
- Ordinal: Los números se utilizan para diferenciar un orden de supremacía de acuerdo con cierto criterio jerárquico.
- De Intervalos: Permite ordenar las mediciones y decir también en cuánto difiere una situación de otra (1 unidad de medida y un origen (0) arbitrario).
- De razón: Posee una unidad de medida y un punto de origen no arbitrario (0 verdadero).
Organización y Presentación de Datos
Tabla de Frecuencias: Agrupación de datos cualitativos en clases mutuamente excluyentes que muestran el número de observaciones en cada clase.
- Ordenamiento de datos cuantitativos: Ascendente o descendente.
Distribución de Frecuencias: Representación estructurada en forma de tabla de toda la información que se ha recogido sobre la variable que se estudia.
Frecuencia: Número de veces que aparece un valor X en una muestra.
Frecuencia Acumulada: Se obtiene sumando todas las frecuencias correspondientes a los valores de la muestra que son menores o iguales a X.
Frecuencia Relativa: Se obtiene dividiendo la frecuencia entre el tamaño n de la muestra.
Frecuencia Relativa Acumulada: División de la frecuencia acumulada entre el tamaño de la muestra.
Clases: Grupos de valores que describen una característica de los datos.
Marca de clase: Puntos medios de la clase.
Amplitud de clase: Diferencia entre los dos límites de clase superiores consecutivos o entre dos límites de clase inferiores consecutivos.
Variables y sus Tipos
Variable: Cualquier propiedad o característica de algún evento, objeto o persona que puede tener diferentes valores según las condiciones.
Variable Continua: Aquella que teóricamente puede asumir un número infinito de valores entre las unidades adyacentes de una escala.
Variable Discreta: Aquella para la cual no existen valores posibles entre las unidades adyacentes de una escala.
Límites Reales de una Variable Continua: Son aquellos valores que están por arriba y por debajo de los valores registrados.
Medidas de Tendencia Central y Dispersión
Tendencia Central: Punto medio de una distribución (medidas de posición).
Dispersión: Extensión de los datos en una distribución de frecuencias.
Sesgo: Las curvas que representan los puntos de datos de un conjunto de datos pueden ser simétricas o sesgadas.
Curvas Simétricas: Tienen una forma tal que una línea vertical que pase por el punto más alto de la curva la divide en dos partes iguales.
Media Aritmética (Promedio): Valor que se calcula al promediar un conjunto de datos.
Mediana: Punto situado a la mitad del conjunto de datos, dividiendo el conjunto en dos partes iguales.
Moda: Valor que más a menudo se repite y es el punto más alto de la curva de distribución.
Alcance o Rango: Diferencia entre el valor más alto y el más pequeño.
Medidas de Variación o Dispersión: Describen cómo se dispersan o distribuyen las observaciones de un conjunto de datos.
Varianza: Medida de la distancia, cuadrado promedio, entre la media y cada observación de la población.
Desviación Estándar: Es la raíz cuadrada de la varianza de la población.
Teorema de Chebyshev: Permite determinar dónde están localizados los valores de una distribución de frecuencias con relación a la media.
Coeficiente de Variación: Medida relativa de la dispersión. Expresa la desviación estándar como porcentaje de la media.
Medidas de Posición: Cuartiles, Deciles y Percentiles
Cuartiles: Valores que dividen una sucesión de datos ordenados en cuatro partes iguales.
Deciles: Valores que dividen la sucesión de datos ordenados en diez partes iguales.
Percentiles: Valores que dividen la sucesión de datos ordenados en cien partes iguales.