
CERTIFICADO POR LA UNIVERSIDAD TECNOLÓGICA DE PEREIRA
NOTA ACLARATORIA: Cada curso que oferta la Facultad de Ingenierías de la UTP requiere un número mínimo de participantes para decidir la apertura del curso, si este número no es alcanzado, nos reservamos el derecho de cambio de fecha o cancelación del curso. En caso de haber realizado el pago, se tramitará la devolución del valor recibido en un periodo de 20 días hábiles.
GENERALIDADES
- Fecha de inicio: Etapa de inscripción (hasta completar el mínimo de participantes)
- Modalidad: Virtual
- Horario: Martes y jueves de 7:00 p.m. a 10:00 p.m.
- Duración: 120 horas
- Inversión: $2’500.000
- Contacto: Ing. Fabián Torres
- WhatsApp 3041212711
- Email: extension.ingenierias@utp.edu.co
MEDIOS DE PAGO
Valor a pagar: $400.000 COP
Estado: Estamos en etapa de inscripción, cuando se complete el mínimo de estudiantes se habilitarán los medios de pago.
Una vez realices el pago debes enviar el comprobante de pago y su CC o TI al correo extensión.ingenierias@utp.edu.co
JUSTIFICACIÓN
La Facultad de Ingenierías de la Universidad Tecnológica de Pereira – UTP a
identificado las crecientes necesidades de diferentes sectores económicos,
industriales, académicos y sociales de hacer un buen uso de la información y los
datos que tienen a disposición. Dado lo anterior y con la intención de aportar
mayores herramientas de análisis a nuestros egresados y profesionales
colombianos, se presenta un diplomado riguroso, pensado en brindar
herramientas que aporten a la solución de problemas reales, flexible y virtual para
garantizar la participación de personas en cualquier parte del país y del mundo.
El diplomado está dirigido a ingenieros electricistas, electrónicos, industriales,
mecánicos, agroindustriales, civiles, economistas y en general a todo público y
áreas del conocimiento.
OBJETIVOS
OBJETIVO GENERAL
Brindar herramientas que faciliten la comprensión y desarrollo de un problema de
análisis de datos desde la obtención de la información hasta el desarrollo de
productos de datos.
OBJETIVOS ESPECÍFICOS
- Identificar las fuentes y técnicas adecuadas para la recolección de datos relevantes.
- Desarrollar habilidades para la limpieza, organización y análisis de datos mediante herramientas tecnológicas.
- Aplicar métodos de visualización que permitan interpretar y comunicar los hallazgos obtenidos.
- Diseñar productos de datos que respondan de manera efectiva al problema planteado.
CONTENIDO ACADÉMICO
Introducción al curso
- ¿Por qué es importante la Ciencia de Datos?
- Conceptos fundamentales para el análisis de datos: concepto de variable, tipos de variable, tipos de datos en R.
- Conceptos básicos de estadística descriptiva: Introducción a medidas de tendencia central, probabilidad, distribuciones.
- Herramientas básicas para la ciencia de datos: GitHub y Git con R, introducción a Rmarkdown y a Rpubs.
Fundamentos de programación del lenguaje R
- Introducción al lenguaje R
- Instalación y carga de librerías
- Declaración de variables
- Manejo de vectores, matrices, DataFrames (conjuntos de datos) y listas
- Operaciones básicas entre objetos
- Funciones condicionales
- Programación de ciclos (Estructuras de control)
- Creación de funciones
- Fundamentos de visualización de datos
Adquisición, manipulación y limpieza de datos
- ¿Qué es una base de datos? – Introducción a SQL
- Introducción a Tidyverse
- Carga de datos en R con diferentes fuentes: CSV, SQL, XLSX, XML, Web Scraping
- Funciones para la limpieza de datos
- Funciones para la agregación y resumen de datos
- Manipulación de la estructura de la tabla
- Conceptos de teoría de conjuntos para el uso de funciones de unión (join) de datos
Estadística para el análisis exploratorio de datos (EDA) – Visualización de datos
- Cálculo de estadísticas de resumen
- Correlación de datos
- Visualización del comportamiento de los datos
- Personalización de gráficos
- Transformación de variables como pre-proceso para el modelado
Introducción al procesamiento de lenguaje natural – NLP para analizar
texto
- ¿Qué es el procesamiento de lenguaje natural?
- Herramientas para un análisis de procesamiento de lenguaje natural
- Procesamiento de Lenguaje Natural con Quanteda (Quantitative Analysis of Textual Data)
- Desarrollo de un análisis del discurso
Introducción a la creación e interpretación de mapas
- Importancia de los mapas como herramienta para la visualización de la información
- Introducción a ggplot2 y leaflet para la elaboración de mapas
- ¿Qué tipos de archivos se usan para la elaboración de mapas?
- Ejemplos prácticos
Fundamentos de introducción al Machine Learning
- Introducción al Machine Learning
- Ejecución y estudios de caso usando modelos supervisados (Modelos de regresión y clasificación) y no supervisados (Clustering o agrupamiento de datos)
- Técnicas de selección del modelo más adecuado
- Algunos modelos para revisar: Regresión lineal, Regresión logística, Árboles de decisión, K-means, Clustering jerárquico, KNN, Reglas de Asociación, entre otros.
Desarrollo de productos de datos
- Implementación de reportes tipo word, pdf, HTML con Rmarkdown y reportes web alojados en Rpubs
- Implementación de presentaciones interactivas para la presentación de análisis y resultados.
- Desarrollo de aplicaciones web y tableros dashboards con ShinyApps.
Apuntes sobre la investigación reproducible
- ¿Por qué es importante la investigación reproducible?
- ¿Cómo aporta R a la investigación reproducible?
DOCENTES UTP
