Entradas

Análisis y Analítica

Imagen
 Módulo 4 Clase 2 y Clase 3: Estas clases se llevaron a cabo el 4 y 5 de marzo de 2025 en el Instituto Forum de la Universidad de la Sabana. Dentro de la clase 3 y 4 tuvimos algunos ejercicios y la explicación de la plataforma donde se aloja el material del examen para la certificación, ya que fueron menos contenidos decidí unir las dos clases donde veremos temas muy importantes como: las 7 vs del Bog Data, etapas del ciclo del big data, análisis y analítica de datos. Las 7 Vs del Big Data Empezamos con un tema de gran importancia, y es que el Big Data se caracteriza por siete dimensiones clave: Después pasamos a ver las etapas del ciclo de big data, se trata del periodo en que los datos permanecen o existen en un sistema y su tratamiento efectivo es fundamental para que las empresas puedan obtener valor a través de sus datos. Etapas del ciclo de Big Data Recolección : Captura de datos de diversas fuentes. Almacenamiento : Organización en bases de datos o lagos de d...

Componentes de Big Data y Data Science

Imagen
Módulo 4 Clase 1: Esta clase se llevó a cabo el 3 de marzo de 2025 en el Instituto Forum de la Universidad de la Sabana.  Empezamos un nuevo módulo donde abordaremos todos los temas de la certificación internacional de Big Data y Data Science y nos prepararemos para el examen. Nuestra profesora es Luisa Fernanda Carbonell. Luisa es Historiadora, Magister en Antropología y Magister en Ciencia de Datos. Big Data Fundamentals   Empezamos con repaso general so qué son los datos y cuál es su importancia. ¿Qué es un dato? Un dato es cualquier pedazo de información que podemos observar, medir o registrar. Puede ser algo tan simple como la temperatura de hoy, el número de pasos que diste o el color de un auto. En su forma más básica, un dato es solo un valor sin contexto, pero cuando lo juntamos con otros datos y los analizamos, empiezan a contar una historia. ¿Por qué sin importantes los datos? Los datos son importantes porque nos ayudan a tomar decisiones basadas en hechos y no e...

Matriz de Datos

Imagen
Módulo 1 Clase 3.   Empezamos la clase viendo ¿Qué es una matriz de datos? Una matriz de datos es una forma de organizar la información en filas y columnas, donde cada fila representa una observación (un caso o individuo) y cada columna representa una variable (una característica medida). Es muy utilizada en análisis de datos, estadística y machine learning , ya que permite estructurar la información para aplicar modelos matemáticos y realizar predicciones. Ejemplo de una matriz de datos Supongamos que queremos analizar el tiempo que tardan diferentes personas en leer un libro. Nuestra matriz de datos podría verse así:   Explicación de las columnas : Persona : Identificador de cada observación. Páginas : Número total de páginas del libro. Dificultad : Escala de 1 a 10 (1 muy fácil, 10 muy difícil). Tiempo Diario (min) : Minutos que la persona dedica a leer cada día. Tiempo Lectura (días) : Días que tardó en terminar ...

DISTRIBUCIÓN DE PROBABILIDAD

Imagen
  Módulo 1 Clase 2. Esta clase se llevó a cabo el 10 de febrero de 2025 en Forum de la Universidad de la Sabana. Empezamos la clase hablando sobre el ciclo PPDAC. ¿Qué es?: The PPDAC Cycle es un ciclo investigativo que aborda la gestión de datos; su diseño plantea las etapas que una persona aborda para resolver problemas a través de la evidencia numérica.  Sus pasos son: Problema : Definir claramente la pregunta o el problema que se quiere resolver. Se identifican los objetivos y el contexto del análisis. Plan : Diseñar la estrategia para recopilar y analizar los datos. Se determinan las fuentes de datos, el método de recolección y las herramientas a utilizar. Datos : Recopilar y organizar los datos según el plan establecido. Se validan, limpian y preparan para el análisis. Análisis : Examinar los datos mediante técnicas estadísticas y visualizaciones. Se identifican patrones, tendencias y relaciones relevantes para responder la pregunta inicial. Conclusión : Interpretar los ...

FORMULACIÓN DE MODELOS EN ANALÍTICA

Imagen
 ¡Bienvenidos a la primera clase de Formulación de Modelos en Analítica ! Módulo 1 Clase 1. Esta clase se llevó a cabo el 5 de febrero de 2025 en Forum de la Universidad de la Sabana. Conocimos a nuestro profesor Samuel Yaya , estadístico de la Universidad Nacional dedicado a la analítica estratégica de datos para generar valor a los negocios es además humanista y runner aficionado. Probabilidad en Estadística En la introducción a la clase hablemos sobre algunos términos que vamos a abordar a lo largo del módulo, como por ejemplo ¿qué es un percentil ? o ¿ qué es la probabilidad ? Y así entramos a ver el diagrama de Venn sobre la ciencia de datos. Destaco de este punto el énfasis que hace el profe sobre el trabajo colaborativo , teniendo en cuenta las diferentes ramas que componen el trabajo de Data Science su fin no debería ser experto en cada una de ellas sino acoplarse a una dinámica dentro de un equipo de trabajo con especialistas en cada una de ellas. Importancia del Big Data...