Entradas

Mostrando las entradas de febrero, 2025

Matriz de Datos

Imagen
Módulo 1 Clase 3.   Empezamos la clase viendo ¿Qué es una matriz de datos? Una matriz de datos es una forma de organizar la información en filas y columnas, donde cada fila representa una observación (un caso o individuo) y cada columna representa una variable (una característica medida). Es muy utilizada en análisis de datos, estadística y machine learning , ya que permite estructurar la información para aplicar modelos matemáticos y realizar predicciones. Ejemplo de una matriz de datos Supongamos que queremos analizar el tiempo que tardan diferentes personas en leer un libro. Nuestra matriz de datos podría verse así:   Explicación de las columnas : Persona : Identificador de cada observación. Páginas : Número total de páginas del libro. Dificultad : Escala de 1 a 10 (1 muy fácil, 10 muy difícil). Tiempo Diario (min) : Minutos que la persona dedica a leer cada día. Tiempo Lectura (días) : Días que tardó en terminar ...

DISTRIBUCIÓN DE PROBABILIDAD

Imagen
  Módulo 1 Clase 2. Esta clase se llevó a cabo el 10 de febrero de 2025 en Forum de la Universidad de la Sabana. Empezamos la clase hablando sobre el ciclo PPDAC. ¿Qué es?: The PPDAC Cycle es un ciclo investigativo que aborda la gestión de datos; su diseño plantea las etapas que una persona aborda para resolver problemas a través de la evidencia numérica.  Sus pasos son: Problema : Definir claramente la pregunta o el problema que se quiere resolver. Se identifican los objetivos y el contexto del análisis. Plan : Diseñar la estrategia para recopilar y analizar los datos. Se determinan las fuentes de datos, el método de recolección y las herramientas a utilizar. Datos : Recopilar y organizar los datos según el plan establecido. Se validan, limpian y preparan para el análisis. Análisis : Examinar los datos mediante técnicas estadísticas y visualizaciones. Se identifican patrones, tendencias y relaciones relevantes para responder la pregunta inicial. Conclusión : Interpretar los ...

FORMULACIÓN DE MODELOS EN ANALÍTICA

Imagen
 ¡Bienvenidos a la primera clase de Formulación de Modelos en Analítica ! Módulo 1 Clase 1. Esta clase se llevó a cabo el 5 de febrero de 2025 en Forum de la Universidad de la Sabana. Conocimos a nuestro profesor Samuel Yaya , estadístico de la Universidad Nacional dedicado a la analítica estratégica de datos para generar valor a los negocios es además humanista y runner aficionado. Probabilidad en Estadística En la introducción a la clase hablemos sobre algunos términos que vamos a abordar a lo largo del módulo, como por ejemplo ¿qué es un percentil ? o ¿ qué es la probabilidad ? Y así entramos a ver el diagrama de Venn sobre la ciencia de datos. Destaco de este punto el énfasis que hace el profe sobre el trabajo colaborativo , teniendo en cuenta las diferentes ramas que componen el trabajo de Data Science su fin no debería ser experto en cada una de ellas sino acoplarse a una dinámica dentro de un equipo de trabajo con especialistas en cada una de ellas. Importancia del Big Data...