Módulo 1.1 - Estadística Descriptiva (Tablas estadísticas y Tratamiento gráfico)
Video: https://youtu.be/BkSHNKjARYU?si=L73qsAbYOhmW7ndO
Table of Contents:
A) ¿Qué es la Estadística?
Lo primero que vamos a hacer es dar una definición de "[[Estadística]]".
La [[estadística]] es un conjunto de métodos necesarios para: recoger, sintetizar y analizar información a partir de [[datos]] (cuya característica fundamental es la [[VARIABILIDAD]]), para extraer conclusiones científicas.
Observese que la caracteristica "[[variabilidad]]" es importante.
Por ejemplo, si estamos haciendo un estudio y todos los sujetos tienen la misma edad. Cualquier diferencia que aparezca entre ellos no será debido a la edad.
Recuerda: En estadística nos interesan los [[DATOS]] que son VARIABLES
B) Población y Muestra
Dos conceptos fundamentales en estadística son el concepto de "[[población]]"y el concepto de "[[muestra]]".
Se pueden entender como dos conjuntos:
-
[[Población]]: es el conjunto objeto de estudio.
-
[[Muestra]]: es otro conjunto, extraido de la población y es representativo. En este conjunto es donde vamos a llevar acabo el estudio.
El primer paso en estadística es ver como seleccionar una muestra que de verdad sea representativa.
Y hay que responder a 2 preguntas:
-
¿Cuántos sujetos son necesarios para que la muestra sea representativa?
-
¿Cuáles sujetos deben formar parte de la muestra?
Nota: Este paso esta fuera del alcanze de este curso, pero es conveniente que se sepa para tenerlo en cuenta en un estudio real.
B.1) Estadística Descriptiva
Ahora vamos a central la atención en la [[muestra]],
- Cuando hacemos un estudio estadístico en la [[muestra]], a esa estudio estadístico se le conoce como: "[[Estadistica Descriptiva]]"
Y el objetivo es:
- Tabular la información
- Hacer representaciones gráficas
- Presentar valores de "síntesis" de esos datos.
B.2) Estadística Inferencial
- Cuando estudiamos una [[muestra]], la mayor parte de las veces, lo hacemos con el fin de poder extrapolar los resultados a la [[población]] de la que se ha extraído esa [[muestra]].
A este proceso se le conoce en estadística como: "[[Estadística Inferencial]] "
Tenemos por lo tanto que diferenciar claramente entre "[[Estadística Descriptiva]]"y "[[Estadistica Inferecial]]"
C) Tipos de Variables (escalas de medición)
Cuando vamos a hacer un estudio estadístico hay que tener en cuenta los diferentes tipos de variables que hay
No es lo mismo poder "[[cuantificar]]" los valores que presenta la variable, que encontrarnos con que los valores que presenta la variable son simplemente "categorias" que a veces ni siquiera están ordenadas.
Los tipos de variable son:
graph LR; Variables --> Cualitativas Variables --> Cuantitativas Cualitativas --> Nominales Cualitativas --> Ordinales Cuantitativas --> Discretas Cuantitativas --> Continuas Nominales --> Ej1["Ej: sabores de soda (no hay orden)"] Ordinales --> Ej2["Ej: el grado profesional (hay orden)"] Discretas --> Ej3["Ej: el nº hijos {2,3}"] Continuas --> Ej4["Ej: peso/altura {62.5kg, 1.75m}"] classDef someclass1 fill:#ff4500,stroke:#add8e6,stroke-width:2px; class Nominales,Ordinales someclass1; classDef someclass2 fill:#808000,stroke:#add8e6,stroke-width:2px; class Discretas,Continuas someclass2; %% Ajustar el tamaño de la letra style Ej1 font-size:12px; style Ej2 font-size:12px; style Ej3 font-size:12px; style Ej4 font-size:12px;
Una variable cualitativa también puede ser "dicotomica", es decir, es una variable de 2 categorías complementarias.
Por ejemplo: Sí/No, Mucho/Poco, Hombre/Mujer, etc.
La variable cuantitativa "continua" puede ser de "intervalo" o de "razón".
- De Intervalo
Las variables de intervalo representan magnitudes cuya distancia en la escala es igual pero carecen de un "cero absoluto".
Por ejemplo: La temperatura en grados Celsius·
- De Razón
Las variables de razón son similares a las de intervalo, solo que estas si tienen "cero absoluto"
Por ejemplo: Temperatura en Kelvin, la altura, el peso, el salario,
Dependiendo el tipo de variable que tengamos, podemos determinar propiedades y operaciones matemáticas con esa información.
Provides: | Nominal | Ordinal | Interval | Ratio |
---|---|---|---|---|
The "order" of values is known | ✔️ | ✔️ | ✔️ | ✔️ |
"Counts," aka "Frequency of Distribution" | ✔️ | ✔️ | ✔️ | ✔️ |
Mode | ✔️ | ✔️ | ✔️ | ✔️ |
Median | ✔️ | ✔️ | ✔️ | |
Mean | ✔️ | ✔️ | ||
Can quantify the difference between each value | ✔️ | ✔️ | ||
Can add or subtract values | ✔️ | ✔️ | ||
Can multiply and divide values | ✔️ | |||
Has "True zero" | ✔️ |
De igual forma, dependiendo del nivel de medición de la variable independiente y dependiente, podemos determinar que tipos de análisis estadísticos que se pueden aplicar para el diseño de un investigación.
Independent Variable Level | Dependent Variable Level | Analysis |
---|---|---|
Dichotomous | Continuous | Independent Samples t-Test, Linear Regression |
Nominal or Ordinal | Continuous | ANOVA |
Continuous | Continuous | Linear Regression, Pearson's Correlation |
Continuous or Categorical | Dichotomous | Binary Logistic Regression |
Continuous or Categorical | Ordinal | Ordinal Logistic Regression |
Categorical | Categorical | Chi Square |
D) EJEMPLO - Estadística Descriptiva (Un Club Deportivo)
D.1) Información en Tablas de Distribución
Ahora vamos a imaginar que estamos llevando a cabo un estudio en un club deportivo. Y estamos estudiando las caracteristicas de las mujeres que van a este club.
Imaginamos que hemos preguntado sobre su estado civil.
(la cual es una variable cualitativa de tipo nominal).
Supongamos que hemos preguntado a 200 mujeres, entonces tenemos un tamaño muestral de
Y esto es lo que obtenemos:
Evidentemente, aquí esta toda la informacion.
Pero como podemos apreciar, esto es dificil de manejar.
Si alguien pregunta:
- ¿cuantas mujeres casadas van al club?
Tendriamos que contar todas las respuestas, lo cual no es nada práctico.
Bueno, si esta misma información la presentamos en forma de Tabla, es mucho was manejable.
D.1.1) Frecuencia Absoluta
Veamos un ejemplo:
En esta tabla, tenemos las 4 categorias del estado civil: casada, soltera, divorciada y viuda.
Y al hacer el recuento de los resultados de las 200 mujeres, vemos que hay:
- 100 casadas
- 56 solteras
- 30 Divorciadas
- 14 viudas
A estos valores se le conocen como "Frecuencia Absoluta"
La "Frecuencia Absoluta" generalmente se denota como
Por ejemplo:
i = 1 hace referencia a las casadas
i = 2 hace referencia a las solteras
i = 3 hace referencia a las divorciadas
i = 4 hace referencia a las viudas
Entonces las frecuencias son,
D.1.2) Frecuencia Relativa
Usar la frecuencia absoluta es una forma facil de dar la información.
Sin embargo, si uno no tiene referencia sobre cuantas mujeres formaban parte del estudio, decir "100 mujeres" o "56 mujeres" no dice mucho; ya que no es lo mismo 100 de 200 mujeres a 100 de 1000 mujeres.
Entonces es aún mas interesante, expresar la información en forma de "Frecuencia Relativa", que para distinguirla de la anterior, se denota como
¿Y cómo se calcula?
Se calcula utilizando la "Frecuencia Absoluta" y el "tamaño muestral",
Y ahora podemos hacer la siguiente tabla,
Ahora podemos decir, que en ese club:
- el 50% de las mujeres son casadas,
- un 28% son solteras,
- un 15% son divorciadas
- y un 7% son viudas
La información ahora es mucho mas manejable.
A estas tablas se les conocen como "Tablas de Distribución" (o "Tablas Estadísticas").
D.2) Información en Gráficas
La tabla del ejemplo anterior, también se puede presentar en forma gráfica, por ejemplo, con un "Diagrama de Barras"
D.2.1) Diagramas de Barras
¿Cómo se hace un Diagrama de Barras?
Se toman los "ejes cartesianos",
- en el "eje de las abscisas" se colocan los valores de la variable cuantitativa
- y en el "eje de ordenadas" se coloca la frecuencia (puede ser
, o el %, da igual).
La información interesante esta capturada por la altura de la figura.
Inmediatamente vemos en el ejemplo, que es más frecuente encontrar mujeres casadas en el club y las que menos frecuentan el club son las viudas.
D.2.2) Polígonos de Frecuencias
Esta información también puede representarse con un "Polígono de Frecuencias"
¿Cómo se hace un Polígono da Frecuencias?
Se toma el valor de la frecuencia (la altura del Diagrama de Barras), y se unen los valores con una linea poligonal abierta la cual me da la misma información sobre las
distintas categorías. (En este caso, del estado civil de las mujeres que asisten al club).
El poíigono de frecuencias es muy útil, por ejemplo, se puede usar para mostrar los datos de desempleo de varios paises europeos despues de introducir el euro y despues de la crisis.
D.2.3) Diagrama de Sectores (Pie Chart)
La tabla del ejemplo de las mujeres del club, también se puede presentar en otra forma gráfica, por ejemplo, con un "Diagrama de Sectores"
¿Cómo se hace un Diagrama de Sectores?
Se toman los 360° del circulo y se hacen corresponder con el tamaño muestral.
Y para calcular el "ángulo correspondiente" digamos
se hace una regla de tres con la frecuencia absoluta,
El diagrama de sectores también es muy útil, por ejemplo, se puede usar para mostrar las causas de la ingesta de paracetamol.
D.2.4) Histograma vs. Diagrama de Barras
Es importante que distingamos entre lo que es un Diagrama de Barras y un Histograma.
Porque el aspecto es parecido y muchos investigadores los confunden.
Observen un primer detalle, en el caso anterior con el diagrama de barras, usamos información de tipo cualitativo.
Sin embargo, en el caso del histograma tenemos información de tipo continuo.
Para hacer este nuevo diagrama, también hemos pesado a las 200 mujeres en nuestro estudio estadístico.
Lo importante ahora es que el "CRITERIO DE REPRESENTACION" ya no es
Ahora es
Si todos los intervalos que hacen de base a los rectángulos son iguales, entonces el CRITERIO DE REPRESENTACION del histograma sería equivalente al del diagrama de barras, ya que podemos considerar a las bases iguales como unitarias y la altura correspondería con la frecuencia.
Pero si los intervalos que hacen la base de los rectángulos es diferente, entonces ya no son equivalentes.
D.2.4.1) Histograma con Polígono de Frecuencias
La información del histograma también puede representarse con un "Polígono de Frecuencias"
¿Cómo se hace un Polígono da Frecuencias?
Se toman los puntos medios de los rectángulos del histograma y los unimos con una línea poligonal abierta.
D.2.5) Advertencia sobre el uso de Gráficos
Nota: ¡Cuidado con los gráficos!
Porque a veces pueden inducir error...*
Por ejemplo: El siguiente gráfico corresponde a la portada de la Nueva Prensa de Oriente, que refleja los resultados de las pasadas elecciones en Venezuela.
**¿La portada refleja de manera correcta los resultados de las elecciones?
D.2.6) Más Gráficos: Contenido Extra (links 🔗)
Más información sobre:
Gráficos estadísticos y ejemplos con datos reales
https://www.ine.es/explica/docs/pasos_tipos_graficos.pdf
Etapas en la aparición de los diferentes gráficos estadísticos...
https://www.ine.es/explica/docs/pasos_historia_graficos.pdf
🔙 Previous Part | Next Part 🔜
Z) 🗃️ Glossary
File | Definition |
---|