Módulo 1.1 - Estadística Descriptiva (Tablas estadísticas y Tratamiento gráfico)

Video: https://youtu.be/BkSHNKjARYU?si=L73qsAbYOhmW7ndO

#Statistics #Math

🔙 Previous Part | Next Part 🔜

↩️ Go Back

Table of Contents:


A) ¿Qué es la Estadística?

Lo primero que vamos a hacer es dar una definición de "[[Estadística]]".

¿Que es la Estadística?

La [[estadística]] es un conjunto de métodos necesarios para: recoger, sintetizar y analizar información a partir de [[datos]] (cuya característica fundamental es la [[VARIABILIDAD]]), para extraer conclusiones científicas.

Observese que la caracteristica "[[variabilidad]]" es importante.

Por ejemplo, si estamos haciendo un estudio y todos los sujetos tienen la misma edad. Cualquier diferencia que aparezca entre ellos no será debido a la edad.

|250

Recuerda: En estadística nos interesan los [[DATOS]] que son VARIABLES


B) Población y Muestra

Dos conceptos fundamentales en estadística son el concepto de "[[población]]"y el concepto de "[[muestra]]".

Se pueden entender como dos conjuntos:

  1. [[Población]]: es el conjunto objeto de estudio.

  2. [[Muestra]]: es otro conjunto, extraido de la población y es representativo. En este conjunto es donde vamos a llevar acabo el estudio.

El primer paso en estadística es ver como seleccionar una muestra que de verdad sea representativa.

Y hay que responder a 2 preguntas:

  1. ¿Cuántos sujetos son necesarios para que la muestra sea representativa?

  2. ¿Cuáles sujetos deben formar parte de la muestra?

Contenido del curso

Nota: Este paso esta fuera del alcanze de este curso, pero es conveniente que se sepa para tenerlo en cuenta en un estudio real.

B.1) Estadística Descriptiva

Ahora vamos a central la atención en la [[muestra]],

Y el objetivo es:


B.2) Estadística Inferencial

A este proceso se le conoce en estadística como: "[[Estadística Inferencial]] "

Nota

Tenemos por lo tanto que diferenciar claramente entre "[[Estadística Descriptiva]]"y "[[Estadistica Inferecial]]"


C) Tipos de Variables (escalas de medición)

Cuando vamos a hacer un estudio estadístico hay que tener en cuenta los diferentes tipos de variables que hay

No es lo mismo poder "[[cuantificar]]" los valores que presenta la variable, que encontrarnos con que los valores que presenta la variable son simplemente "categorias" que a veces ni siquiera están ordenadas.

Los tipos de variable son:

graph LR;
  Variables --> Cualitativas
  Variables --> Cuantitativas
  Cualitativas --> Nominales
  Cualitativas --> Ordinales
  Cuantitativas --> Discretas
  Cuantitativas --> Continuas

  Nominales --> Ej1["Ej: sabores de soda (no hay orden)"]
  Ordinales --> Ej2["Ej: el grado profesional (hay orden)"]
  Discretas --> Ej3["Ej: el nº hijos {2,3}"]
  Continuas --> Ej4["Ej: peso/altura {62.5kg, 1.75m}"]

  classDef someclass1 fill:#ff4500,stroke:#add8e6,stroke-width:2px;
  class Nominales,Ordinales someclass1;

  classDef someclass2 fill:#808000,stroke:#add8e6,stroke-width:2px;
  class Discretas,Continuas someclass2;

  %% Ajustar el tamaño de la letra
  style Ej1 font-size:12px;
  style Ej2 font-size:12px;
  style Ej3 font-size:12px;
  style Ej4 font-size:12px;
Notas sobre las variables cualitativas

Una variable cualitativa también puede ser "dicotomica", es decir, es una variable de 2 categorías complementarias.

Por ejemplo: Sí/No, Mucho/Poco, Hombre/Mujer, etc.

Notas sobre las variables continuas

La variable cuantitativa "continua" puede ser de "intervalo" o de "razón".

|500

- De Intervalo
Las variables de intervalo representan magnitudes cuya distancia en la escala es igual pero carecen de un "cero absoluto".

Por ejemplo: La temperatura en grados Celsius·
|400


- De Razón
Las variables de razón son similares a las de intervalo, solo que estas si tienen "cero absoluto"

Por ejemplo: Temperatura en Kelvin, la altura, el peso, el salario,
|400

Dependiendo el tipo de variable que tengamos, podemos determinar propiedades y operaciones matemáticas con esa información.

Provides: Nominal Ordinal Interval Ratio
The "order" of values is known ✔️ ✔️ ✔️ ✔️
"Counts," aka "Frequency of Distribution" ✔️ ✔️ ✔️ ✔️
Mode ✔️ ✔️ ✔️ ✔️
Median ✔️ ✔️ ✔️
Mean ✔️ ✔️
Can quantify the difference between each value ✔️ ✔️
Can add or subtract values ✔️ ✔️
Can multiply and divide values ✔️
Has "True zero" ✔️

De igual forma, dependiendo del nivel de medición de la variable independiente y dependiente, podemos determinar que tipos de análisis estadísticos que se pueden aplicar para el diseño de un investigación.

Independent Variable Level Dependent Variable Level Analysis
Dichotomous Continuous Independent Samples t-Test, Linear Regression
Nominal or Ordinal Continuous ANOVA
Continuous Continuous Linear Regression, Pearson's Correlation
Continuous or Categorical Dichotomous Binary Logistic Regression
Continuous or Categorical Ordinal Ordinal Logistic Regression
Categorical Categorical Chi Square

D) EJEMPLO - Estadística Descriptiva (Un Club Deportivo)

D.1) Información en Tablas de Distribución

Ahora vamos a imaginar que estamos llevando a cabo un estudio en un club deportivo. Y estamos estudiando las caracteristicas de las mujeres que van a este club.

Imaginamos que hemos preguntado sobre su estado civil.
(la cual es una variable cualitativa de tipo nominal).

Supongamos que hemos preguntado a 200 mujeres, entonces tenemos un tamaño muestral de n=200,

Y esto es lo que obtenemos:

Evidentemente, aquí esta toda la informacion.

Pero como podemos apreciar, esto es dificil de manejar.

Si alguien pregunta:

Tendriamos que contar todas las respuestas, lo cual no es nada práctico.

Bueno, si esta misma información la presentamos en forma de Tabla, es mucho was manejable.

D.1.1) Frecuencia Absoluta

Veamos un ejemplo:

En esta tabla, tenemos las 4 categorias del estado civil: casada, soltera, divorciada y viuda.
|170

Y al hacer el recuento de los resultados de las 200 mujeres, vemos que hay:

A estos valores se le conocen como "Frecuencia Absoluta"

La "Frecuencia Absoluta" generalmente se denota como fi donde la letra "i" hace referencia a las diferentes categorias.

Por ejemplo:
i = 1 hace referencia a las casadas
i = 2 hace referencia a las solteras
i = 3 hace referencia a las divorciadas
i = 4 hace referencia a las viudas

Entonces las frecuencias son,
f1 = 100
f2 = 56
f3 = 30
f4 = 14

D.1.2) Frecuencia Relativa

Usar la frecuencia absoluta es una forma facil de dar la información.

Sin embargo, si uno no tiene referencia sobre cuantas mujeres formaban parte del estudio, decir "100 mujeres" o "56 mujeres" no dice mucho; ya que no es lo mismo 100 de 200 mujeres a 100 de 1000 mujeres.

Entonces es aún mas interesante, expresar la información en forma de "Frecuencia Relativa", que para distinguirla de la anterior, se denota como hi

¿Y cómo se calcula?

Se calcula utilizando la "Frecuencia Absoluta" y el "tamaño muestral",

hi=fi/n

Y ahora podemos hacer la siguiente tabla,

Ahora podemos decir, que en ese club:

La información ahora es mucho mas manejable.

A estas tablas se les conocen como "Tablas de Distribución" (o "Tablas Estadísticas").


D.2) Información en Gráficas

La tabla del ejemplo anterior, también se puede presentar en forma gráfica, por ejemplo, con un "Diagrama de Barras"

D.2.1) Diagramas de Barras

¿Cómo se hace un Diagrama de Barras?

Se toman los "ejes cartesianos",

  1. en el "eje de las abscisas" se colocan los valores de la variable cuantitativa
  2. y en el "eje de ordenadas" se coloca la frecuencia (puede ser fi, hi o el %, da igual).

La información interesante esta capturada por la altura de la figura.

Inmediatamente vemos en el ejemplo, que es más frecuente encontrar mujeres casadas en el club y las que menos frecuentan el club son las viudas.


D.2.2) Polígonos de Frecuencias

Esta información también puede representarse con un "Polígono de Frecuencias"

¿Cómo se hace un Polígono da Frecuencias?

Se toma el valor de la frecuencia (la altura del Diagrama de Barras), y se unen los valores con una linea poligonal abierta la cual me da la misma información sobre las
distintas categorías. (En este caso, del estado civil de las mujeres que asisten al club).

Nota: otro ejemplo del polígono de frecuencias

El poíigono de frecuencias es muy útil, por ejemplo, se puede usar para mostrar los datos de desempleo de varios paises europeos despues de introducir el euro y despues de la crisis.


D.2.3) Diagrama de Sectores (Pie Chart)

La tabla del ejemplo de las mujeres del club, también se puede presentar en otra forma gráfica, por ejemplo, con un "Diagrama de Sectores"

¿Cómo se hace un Diagrama de Sectores?

Se toman los 360° del circulo y se hacen corresponder con el tamaño muestral.

Y para calcular el "ángulo correspondiente" digamos θi

se hace una regla de tres con la frecuencia absoluta,

θi=(360n)fi=360hi
Nota: otro ejemplo del diagrama de sectores

El diagrama de sectores también es muy útil, por ejemplo, se puede usar para mostrar las causas de la ingesta de paracetamol.


D.2.4) Histograma vs. Diagrama de Barras

Es importante que distingamos entre lo que es un Diagrama de Barras y un Histograma.

Porque el aspecto es parecido y muchos investigadores los confunden.

Observen un primer detalle, en el caso anterior con el diagrama de barras, usamos información de tipo cualitativo.

Sin embargo, en el caso del histograma tenemos información de tipo continuo.

Para hacer este nuevo diagrama, también hemos pesado a las 200 mujeres en nuestro estudio estadístico.

|170

Nota: rectángulos del histograma

Lo importante ahora es que el "CRITERIO DE REPRESENTACION" ya no es Altura=frecuencia como en el diagrama de barras.

Ahora es Area del rectangulo=frecuencia.

Si todos los intervalos que hacen de base a los rectángulos son iguales, entonces el CRITERIO DE REPRESENTACION del histograma sería equivalente al del diagrama de barras, ya que podemos considerar a las bases iguales como unitarias y la altura correspondería con la frecuencia.

Pero si los intervalos que hacen la base de los rectángulos es diferente, entonces ya no son equivalentes.


D.2.4.1) Histograma con Polígono de Frecuencias

La información del histograma también puede representarse con un "Polígono de Frecuencias"

¿Cómo se hace un Polígono da Frecuencias?
Se toman los puntos medios de los rectángulos del histograma y los unimos con una línea poligonal abierta.


D.2.5) Advertencia sobre el uso de Gráficos

Nota: ¡Cuidado con los gráficos!

Porque a veces pueden inducir error...*

Por ejemplo: El siguiente gráfico corresponde a la portada de la Nueva Prensa de Oriente, que refleja los resultados de las pasadas elecciones en Venezuela.

**¿La portada refleja de manera correcta los resultados de las elecciones?


Más información sobre:

Gráficos estadísticos y ejemplos con datos reales
https://www.ine.es/explica/docs/pasos_tipos_graficos.pdf

Etapas en la aparición de los diferentes gráficos estadísticos...
https://www.ine.es/explica/docs/pasos_historia_graficos.pdf


🔙 Previous Part | Next Part 🔜

↩️ Go Back


Z) 🗃️ Glossary

File Definition