Introducción (Resumen):
En este programa se detallará contenido referente a la Ciencia de Datos y la importancia de su conocimiento y uso en diferentes sectores industriales y financieros. Se hablará a grandes rasgos del uso de los softwares y metodología SEMMA para el desarrollo, implementación y validación de modelos.
El alumno conocerá cómo dar explicación en el diagnostico de problemáticas comunes al utilizar datos, como lidiar con valores faltantes y valores atípicos. Visualización y uso de softwares y exploración visual.
Enfoque en recordar herramientas estadísticas, distribuciones y modelos básicos para la aplicación con datos reales con el objetivo de desarrollar modelos enfocados a una problemática en general o particular con datos simulados o reales.
Finalmente se conocerán las generalidades del aprendizaje supervisado, no supervisado y automático y/o de agrupación.
Objetivo del Programa (Resumen):
Definir qué es la ciencia de datos poniendo especial foco en el flujo de los datos de trabajo, la estadística y la visualización de la información, aplicados a problemáticas de la vida real, examinando los diferentes roles dentro de dicha ciencia introduciendo las diferentes técnicas, herramientas y forma lógica de las soluciones.
Perfil del Participante:
No se necesita ser experto en algún tema de matemáticas o programación, sin embargo, se requiere de la lógica para la implementación e introducción a la Ciencias de Datos, específicamente conocimientos de estadística y bases de algún lenguaje de programación.
Perfil de Egreso:
Al final del programa el participante será capaz de:
- Comprender la importancia que tiene la Ciencia de datos en diferentes industrias.
- Identificar de las diferentes fuentes de datos, visualización de estos, almacenamiento, canalización y automatización
- Diseñar pruebas lógicas o A/B, series de tiempo
- Entender la importancia de la temporalidad con enfoque a la predicción de tiempo futuros.
Temario del Programa.
- ¿Ciencia de Datos?: Softwares para la analítica, desarrollo e implementación y sus lenguajes de programación.
- Recopilación de los datos y su almacenamiento
- Preparación, exploración y visualización
- Estadística y desarrollo de modelos
- Experimentación y predicción. Validación e implementación de modelos