FORMULACIÓN DE MODELOS EN ANALÍTICA

 ¡Bienvenidos a la primera clase de Formulación de Modelos en Analítica!

Módulo 1 Clase 1. Esta clase se llevó a cabo el 5 de febrero de 2025 en Forum de la Universidad de la Sabana.


Conocimos a nuestro profesor Samuel Yaya, estadístico de la Universidad Nacional dedicado a la analítica estratégica de datos para generar valor a los negocios es además humanista y runner aficionado.

Probabilidad en Estadística

En la introducción a la clase hablemos sobre algunos términos que vamos a abordar a lo largo del módulo, como por ejemplo ¿qué es un percentil? o ¿qué es la probabilidad?

Y así entramos a ver el diagrama de Venn sobre la ciencia de datos.



  • Destaco de este punto el énfasis que hace el profe sobre el trabajo colaborativo, teniendo en cuenta las diferentes ramas que componen el trabajo de Data Science su fin no debería ser experto en cada una de ellas sino acoplarse a una dinámica dentro de un equipo de trabajo con especialistas en cada una de ellas.

Importancia del Big Data


Luego entramos a explorar ¿por qué es importante Big Data?

La respuesta corta y simple es: porque nos ayuda a tomar decisiones inteligentes basadas en datos.

Podemos además mencionar otras ventajas como:

  • Nos permite analizar grandes cantidades de datos para obtner información que sea valiosa para determinado fin o servicio.
  • Podemos desarrollar nuevos productos basados en datos.
  • Permite mejorar el rendimiento de un negocio
  • Permite mejorar la calidad de vida de los seres humanos.
Y sobre este último punto también se hizo un énfasis especial destacando el componente social que sumado al análisis de datos beneficia a las personas:

"La ciencia con los datos ayuda a mejorar vidas" 

 Vimos ejemplos como el de la aplicación Waze, un app colaborativa que se basa en datos que comparten los usuarios en tiempo real y ayuda a optimizar el tiempo y la calidad de la conducción ofreciendo las mejores rutas y alternativas. Si se quieren inspirar con su historia les dejo este artículo: Caso Waze, un viaje interactivo.


Visualización de Datos

Llegó el momento interactivo de la clase con un ejercicio que nos llevaba a construir una propuesta para visualizar datos. La idea era que con una base de datos pequeña pudieramos imaginas y construir en excel un gráfico que nos llevara a mostrar los datos contenidos en la tabla.

El ejercicio se basó en información sobre la venta de los carros eléctricos e híbridos durante el 2024 en Colombia con datos reales publicados en este artículo de la Revista Motor.


Siguiendo la premisa de construir el gráfico en excel con los datos de la tabla, se presentaron varias propuestas, a continuación comparto la mia: (para esto ejercicio tuvimos alrededor de 10 minutos)


Para esta propuesta cree una columna adicional de la tabla que calcular la diferencia año a año:

Después de ser socializado la retroalimentación arrojó algunos aspectos positivos y otros a mejorar como:

  • Título: debería enfocarse en destacar el énfasis que se le dio al análisis que fue la variación, incluir la ubicación geográfica y así mismo podría ser más llamativo si se redacta a nivel de insight, ejemplo: "En Colombia aumentó un 23% la venta de autos eléctricos durante el 2024"
  • Líneas: deberían reservarse para mostrar evolución en el tiempo, aunque no es una regla estrica es una recomendación.
  • Market share: podríamos tener un análisis más avanzado y visualización más precisa si se calculan datos como el share.
  • Colores: los colores y el orden son visualmente agradables y funcionan.
  • Nombres de los ejes: otra recomendación es que los ejes siempre deberían ir nombrados.

Ahora vamos a ver ejemplo que presentó el profesor con su visión del ejericio:



El cambio principal lo podemos ver en la inclusión de dos cálculos: contribución y participación.

#Marca20232024VariaciónPartic. 1Partic. 2Contribución
1Toyota9,76612,45928%35.1%29.2%9.7%
2Mazda5,3807,68043%19.3%18.0%8.3%
3Suzuki4,1306,70262%14.8%15.7%9.2%
4Ford1,2892,776115%4.6%6.5%5.3%
5Kia3462,076500%1.2%4.9%6.2%
6Nissan1,3541,97446%4.9%4.6%2.2%
7Mercedes Benz1,2911,49516%4.6%3.5%0.7%
8Hyundai4851,351179%1.7%3.2%3.1%
9Subaru8201,29057%2.9%3.0%1.7%
10Renault51,07821460%0.0%2.5%3.9%
11BMW60574824%2.2%1.8%0.5%
12BYD722689-5%2.6%1.6%-0.1%
13Audi58464510%2.1%1.5%0.2%
14Volvo772484-37%2.8%1.1%-1.0%
15Chery53707300%0.0%0.9%1.3%
16Cupra52494880%0.0%0.6%0.9%
17Changan51072040%0.0%0.3%0.4%
18MG51052000%0.0%0.2%0.4%
19Land Rover110100-9%0.4%0.2%0.0%
20Foton5781460%0.0%0.2%0.3%
Otras12921264%0.5%0.5%0.3%
27,81342,66853.4%100%100%53.4%


Definiciones:

  1. Participación (Partic. 1 y Partic. 2):

    • Representa el porcentaje de ventas de una marca en relación con el total del mercado en un año determinado.

    • Partic. 1 corresponde al año 2023 y Partic. 2 al 2024.

    • Se calcula con la fórmula:

      Participacioˊn=(Ventas de la marcaTotal de ventas del mercado)×100\text{Participación} = \left( \frac{\text{Ventas de la marca}}{\text{Total de ventas del mercado}} \right) \times 100
  2. Contribución:

    • Mide el impacto de cada marca en el crecimiento o decrecimiento total del mercado.

    • Se obtiene considerando el cambio en las ventas de una marca y su peso relativo en el total del mercado.

    • Su cálculo varía dependiendo de la metodología exacta utilizada, pero en general sigue esta lógica:

      Contribucioˊn=(Crecimiento absoluto de la marcaCrecimiento total del mercado)×100\text{Contribución} = \left( \frac{\text{Crecimiento absoluto de la marca}}{\text{Crecimiento total del mercado}} \right) \times 100

Ejemplo de Cálculo:

  • Toyota en 2023 vendió 9,766 unidades y en 2024 vendió 12,459, lo que representa un aumento del 28%.
  • Su participación de mercado bajó de 35.1% a 29.2%, lo que indica que aunque creció en ventas, otras marcas crecieron más rápido.
  • Su contribución es 9.7%, lo que significa que su crecimiento aportó ese porcentaje al crecimiento total del mercado.

En resumen, la participación mide el peso de la marca en el mercado, mientras que la contribución indica cuánto influye su crecimiento o caída en el total del sector


Tarea: (si como en el colegio 😅) la tarea es leer este texto sobre Estadística Descriptiva

Tip:

Y finalmente una recomendación con la que se cerró la clase y es ejercer el derecho que tenemos como ciudadanos a explorar y usar las bases de datos del DANE dejo acá el link del Catálogo Centra de Datos DANE


Bibliografía Recomendada:

El profe nos recomendó el libro The Art of Statics de David Spiegelhalter


y cierro con una recomedación personal... la parte de Visualización de Datos y el ejercicio relacionado con Periodismo de Datos me trajo a la cabeza a Alberto Cairo, uno de los autores que considero aborda de manera más sencilla y clara la infografía, sobre todo para aquellos que tenemos como base profesiones relacionadas con las humanidades como la comunicación:

De Alberto Cairo recomiendo El Arte Funcional si se quiere empezar de cero o Infografia 2.0 que es como la segunda parte de Functional Art con algunos abirdajes del primero.





















Comentarios

  1. Hola Laura, con respecto al calculo de la contribución, repasando el ejercicio me dio un 18% no un 9.7%. Quizás hay algo en la formula que no este considerando. Me podrías absolver esa duda?

    ResponderBorrar

Publicar un comentario

Entradas más populares de este blog

Componentes de Big Data y Data Science

DISTRIBUCIÓN DE PROBABILIDAD

Matriz de Datos