FORMULACIÓN DE MODELOS EN ANALÍTICA
¡Bienvenidos a la primera clase de Formulación de Modelos en Analítica!
Módulo 1 Clase 1. Esta clase se llevó a cabo el 5 de febrero de 2025 en Forum de la Universidad de la Sabana.
Conocimos a nuestro profesor Samuel Yaya, estadístico de la Universidad Nacional dedicado a la analítica estratégica de datos para generar valor a los negocios es además humanista y runner aficionado.
Probabilidad en Estadística
En la introducción a la clase hablemos sobre algunos términos que vamos a abordar a lo largo del módulo, como por ejemplo ¿qué es un percentil? o ¿qué es la probabilidad?
Y así entramos a ver el diagrama de Venn sobre la ciencia de datos.
- Destaco de este punto el énfasis que hace el profe sobre el trabajo colaborativo, teniendo en cuenta las diferentes ramas que componen el trabajo de Data Science su fin no debería ser experto en cada una de ellas sino acoplarse a una dinámica dentro de un equipo de trabajo con especialistas en cada una de ellas.
Importancia del Big Data
Luego entramos a explorar ¿por qué es importante Big Data?
La respuesta corta y simple es: porque nos ayuda a tomar decisiones inteligentes basadas en datos.
Podemos además mencionar otras ventajas como:
- Nos permite analizar grandes cantidades de datos para obtner información que sea valiosa para determinado fin o servicio.
- Podemos desarrollar nuevos productos basados en datos.
- Permite mejorar el rendimiento de un negocio
- Permite mejorar la calidad de vida de los seres humanos.
"La ciencia con los datos ayuda a mejorar vidas"
Vimos ejemplos como el de la aplicación Waze, un app colaborativa que se basa en datos que comparten los usuarios en tiempo real y ayuda a optimizar el tiempo y la calidad de la conducción ofreciendo las mejores rutas y alternativas. Si se quieren inspirar con su historia les dejo este artículo: Caso Waze, un viaje interactivo.
Visualización de Datos
El ejercicio se basó en información sobre la venta de los carros eléctricos e híbridos durante el 2024 en Colombia con datos reales publicados en este artículo de la Revista Motor.
Siguiendo la premisa de construir el gráfico en excel con los datos de la tabla, se presentaron varias propuestas, a continuación comparto la mia: (para esto ejercicio tuvimos alrededor de 10 minutos)
Para esta propuesta cree una columna adicional de la tabla que calcular la diferencia año a año:
- Título: debería enfocarse en destacar el énfasis que se le dio al análisis que fue la variación, incluir la ubicación geográfica y así mismo podría ser más llamativo si se redacta a nivel de insight, ejemplo: "En Colombia aumentó un 23% la venta de autos eléctricos durante el 2024"
- Líneas: deberían reservarse para mostrar evolución en el tiempo, aunque no es una regla estrica es una recomendación.
- Market share: podríamos tener un análisis más avanzado y visualización más precisa si se calculan datos como el share.
- Colores: los colores y el orden son visualmente agradables y funcionan.
- Nombres de los ejes: otra recomendación es que los ejes siempre deberían ir nombrados.
Ahora vamos a ver ejemplo que presentó el profesor con su visión del ejericio:
| # | Marca | 2023 | 2024 | Variación | Partic. 1 | Partic. 2 | Contribución |
| 1 | Toyota | 9,766 | 12,459 | 28% | 35.1% | 29.2% | 9.7% |
| 2 | Mazda | 5,380 | 7,680 | 43% | 19.3% | 18.0% | 8.3% |
| 3 | Suzuki | 4,130 | 6,702 | 62% | 14.8% | 15.7% | 9.2% |
| 4 | Ford | 1,289 | 2,776 | 115% | 4.6% | 6.5% | 5.3% |
| 5 | Kia | 346 | 2,076 | 500% | 1.2% | 4.9% | 6.2% |
| 6 | Nissan | 1,354 | 1,974 | 46% | 4.9% | 4.6% | 2.2% |
| 7 | Mercedes Benz | 1,291 | 1,495 | 16% | 4.6% | 3.5% | 0.7% |
| 8 | Hyundai | 485 | 1,351 | 179% | 1.7% | 3.2% | 3.1% |
| 9 | Subaru | 820 | 1,290 | 57% | 2.9% | 3.0% | 1.7% |
| 10 | Renault | 5 | 1,078 | 21460% | 0.0% | 2.5% | 3.9% |
| 11 | BMW | 605 | 748 | 24% | 2.2% | 1.8% | 0.5% |
| 12 | BYD | 722 | 689 | -5% | 2.6% | 1.6% | -0.1% |
| 13 | Audi | 584 | 645 | 10% | 2.1% | 1.5% | 0.2% |
| 14 | Volvo | 772 | 484 | -37% | 2.8% | 1.1% | -1.0% |
| 15 | Chery | 5 | 370 | 7300% | 0.0% | 0.9% | 1.3% |
| 16 | Cupra | 5 | 249 | 4880% | 0.0% | 0.6% | 0.9% |
| 17 | Changan | 5 | 107 | 2040% | 0.0% | 0.3% | 0.4% |
| 18 | MG | 5 | 105 | 2000% | 0.0% | 0.2% | 0.4% |
| 19 | Land Rover | 110 | 100 | -9% | 0.4% | 0.2% | 0.0% |
| 20 | Foton | 5 | 78 | 1460% | 0.0% | 0.2% | 0.3% |
| Otras | 129 | 212 | 64% | 0.5% | 0.5% | 0.3% | |
| 27,813 | 42,668 | 53.4% | 100% | 100% | 53.4% | ||
Definiciones:
Participación (Partic. 1 y Partic. 2):
Representa el porcentaje de ventas de una marca en relación con el total del mercado en un año determinado.
Partic. 1 corresponde al año 2023 y Partic. 2 al 2024.
Se calcula con la fórmula:
Contribución:
Mide el impacto de cada marca en el crecimiento o decrecimiento total del mercado.
Se obtiene considerando el cambio en las ventas de una marca y su peso relativo en el total del mercado.
Su cálculo varía dependiendo de la metodología exacta utilizada, pero en general sigue esta lógica:
Participación (Partic. 1 y Partic. 2):
Representa el porcentaje de ventas de una marca en relación con el total del mercado en un año determinado.
Partic. 1 corresponde al año 2023 y Partic. 2 al 2024.
Se calcula con la fórmula:
Contribución:
Mide el impacto de cada marca en el crecimiento o decrecimiento total del mercado.
Se obtiene considerando el cambio en las ventas de una marca y su peso relativo en el total del mercado.
Su cálculo varía dependiendo de la metodología exacta utilizada, pero en general sigue esta lógica:
Ejemplo de Cálculo:
- Toyota en 2023 vendió 9,766 unidades y en 2024 vendió 12,459, lo que representa un aumento del 28%.
- Su participación de mercado bajó de 35.1% a 29.2%, lo que indica que aunque creció en ventas, otras marcas crecieron más rápido.
- Su contribución es 9.7%, lo que significa que su crecimiento aportó ese porcentaje al crecimiento total del mercado.
En resumen, la participación mide el peso de la marca en el mercado, mientras que la contribución indica cuánto influye su crecimiento o caída en el total del sector
Tarea: (si como en el colegio 😅) la tarea es leer este texto sobre Estadística Descriptiva
Tip:
Y finalmente una recomendación con la que se cerró la clase y es ejercer el derecho que tenemos como ciudadanos a explorar y usar las bases de datos del DANE dejo acá el link del Catálogo Centra de Datos DANEBibliografía Recomendada:
El profe nos recomendó el libro The Art of Statics de David Spiegelhaltery cierro con una recomedación personal... la parte de Visualización de Datos y el ejercicio relacionado con Periodismo de Datos me trajo a la cabeza a Alberto Cairo, uno de los autores que considero aborda de manera más sencilla y clara la infografía, sobre todo para aquellos que tenemos como base profesiones relacionadas con las humanidades como la comunicación:
De Alberto Cairo recomiendo El Arte Funcional si se quiere empezar de cero o Infografia 2.0 que es como la segunda parte de Functional Art con algunos abirdajes del primero.


Hola Laura, con respecto al calculo de la contribución, repasando el ejercicio me dio un 18% no un 9.7%. Quizás hay algo en la formula que no este considerando. Me podrías absolver esa duda?
ResponderBorrar