DISTRIBUCIÓN DE PROBABILIDAD

 

Módulo 1 Clase 2. Esta clase se llevó a cabo el 10 de febrero de 2025 en Forum de la Universidad de la Sabana.

Empezamos la clase hablando sobre el ciclo PPDAC. ¿Qué es?: The PPDAC Cycle es un ciclo investigativo que aborda la gestión de datos; su diseño plantea las etapas que una persona aborda para resolver problemas a través de la evidencia numérica. 



Sus pasos son:

  1. Problema: Definir claramente la pregunta o el problema que se quiere resolver. Se identifican los objetivos y el contexto del análisis.

  2. Plan: Diseñar la estrategia para recopilar y analizar los datos. Se determinan las fuentes de datos, el método de recolección y las herramientas a utilizar.

  3. Datos: Recopilar y organizar los datos según el plan establecido. Se validan, limpian y preparan para el análisis.

  4. Análisis: Examinar los datos mediante técnicas estadísticas y visualizaciones. Se identifican patrones, tendencias y relaciones relevantes para responder la pregunta inicial.

  5. Conclusión: Interpretar los resultados del análisis y responder la pregunta inicial. Se sacan conclusiones, se comunican los hallazgos y, si es necesario, se hacen recomendaciones o se plantean nuevos problemas.

Este ciclo se puede repetir iterativamente para mejorar la comprensión y obtener mejores insights.


Y antes de continuar y como no tenemos mucho tiempo, es necesario ponernos en contexto así que acá esta todo lo que debemos saber sobre estadística descriptiva en 10 minutos:



VARIABLE Y CONSTRUCTO

Después pasamos a ver dos conceptos: variable y constructo.

Variable (en estadística)

Una variable es cualquier característica, propiedad o atributo que puede tomar diferentes valores en un conjunto de datos. Puede ser cuantitativa (numérica) o cualitativa (categórica).

Ejemplo:
La edad de los clientes de una tienda es una variable cuantitativa, ya que puede tomar valores como 25, 30 o 45 años.


Constructo (en estadística)

Un constructo es un concepto abstracto que no se puede medir directamente, pero se puede representar a través de variables observables. Se usa comúnmente en ciencias sociales y psicometría.

Ejemplo:
La satisfacción del cliente es un constructo porque no se mide directamente, pero se puede evaluar mediante variables como puntuaciones en encuestas, comentarios de clientes o tasa de recompra.


Ahora un ejercicio de observación y análisis. El profe comaprtió la infografía ¿Cómo es un día liderando? (David Vargas Acosta) y nos pidió compartir lo que nos transmitía. 




De esta observaciónsacamos algunas conclusiones como:

  • Representar creativamente la visualización de datos.
  • Manejar simplicidad en la comunicación: que el tomador de decisiones pueda entender el punto muy rápido.
  • Usar recursos como las formas y los colores para representar la información.

HISTOGRAMA

Pasamos ahora a una de las partes más importantes de la clase y fue descubrir a través de un ejercicio qué es un histograma y cuál era su uso.

La premisa del reto era mostrar graficamente los datos de una base real que mostraba la cantidad de horas que dedicaban hombres y mujeres en Colombia a los oficios domésticos. De la tabla solo debíamos tomar la única variable "horas". 

Surgieron varias miradas de las cuales comparto mi resultado:


¿Qué es un histograma? Una herramienta clave en el análisis de datos

Un histograma es un tipo de gráfico de barras que representa la distribución de un conjunto de datos numéricos. Se utiliza para visualizar cómo se agrupan los datos en intervalos o rangos específicos, permitiendo identificar patrones como la dispersión, la asimetría o la presencia de valores atípicos. A diferencia de un gráfico de barras tradicional, en un histograma las barras están juntas porque representan datos continuos.

Ejemplo de Histograma

Supongamos que un profesor quiere analizar la distribución de las calificaciones de sus estudiantes en un examen. Si tiene las siguientes notas:




Al organizar estos valores en un histograma, se pueden observar los intervalos de calificaciones con mayor frecuencia y determinar si la distribución es normal o está sesgada.

¿Cómo crear un histograma en Excel?

Para crear un histograma en Excel, sigue estos pasos:

  1. Ingresar los datos: Organiza los valores en dos columnas, una con los datos y otra con los intervalos de clase (rangos).
  2. Seleccionar los datos: Resalta la columna con los valores numéricos.
  3. Insertar el histograma:
    • Ve a la pestaña "Insertar".
    • En la sección "Gráficos", selecciona "Histograma" dentro de los gráficos estadísticos.
  4. Configurar el gráfico: Ajusta los intervalos de clase en el eje X y personaliza el diseño según tus necesidades.
Diferencias entre Histograma y Gráfico de Barras


En resumen, el histograma es una herramienta esencial para analizar distribuciones de datos numéricos y tomar decisiones basadas en su comportamiento. Mientras que un gráfico de barras se usa para comparar categorías específicas, el histograma permite entender la variabilidad y la tendencia de un conjunto de datos continuos.

Les dejo por acá el link que compartió el profe sobre ¿qué es un histograma? con más detalles y ejemplos: Histogram

Cierre de la clase

Para finalizar el profe nos compartió una página donde encontramos explicaciones y ejemplos sobre los tipos de gráficos y sus diferencias, la comparto acá: Types of Graphs 









Comentarios

Entradas más populares de este blog

Componentes de Big Data y Data Science

Matriz de Datos