Introducción al Aprendizaje Estadístico
Docente responsable: Forzani Liliana
Carga horaria: 90 h
Carreras para la cual es optativa: Ingeniería Química, Ingeniería en Alimentos, Ingeniería Industrial, Ingeniería en Materiales, Licenciatura en Materiales, Licenciatura en Matemática Aplicada.
Cuatrimestre en el que se brinda: Segundo cuatrimestre
Plantel docente: Liliana Forzani, Andrea Bergesio, Rodrigo García Arancibia, Antonella Gieco, Stefanía D’Iorio, Ignacio Germán Girela y Daniela Agostina González.
Correlatividades necesarias para el cursado:
Licenciatura en Matemática Aplicada
- Plan 1999: Estadística, aprobada. Programación, aprobada. Álgebra Lineal I, aprobada.
- Plan 2018: Introducción a la Probabilidad y Estadística, aprobada. Programación, aprobada. Álgebra Lineal, aprobada.
Ingeniería Industrial
- Administración de Operaciones, regularizada. Probabilidad y Estadística, aprobada. Matemática C, aprobada. Computación, aprobada.
Ingeniería Química, Ingeniería en Alimentos, Ingeniería en Materiales y Licenciatura en Materiales:
- Probabilidad y Estadística, aprobada. Matemática C, aprobada. Informática, aprobada. Matemática D, regularizada.
Objetivos generales
La disponibilidad de datos en cantidades masivas es una característica frecuente en aplicaciones actuales de ciencias cuantitativas. El aprendizaje estadístico provee un conjunto de métodos y algoritmos para ayudar a la comprensión de grandes conjuntos de datos.
En tal dirección, el curso tiene como objetivo introducir al estudiante a las principales herramientas de aprendizaje estadístico, destinadas a extraer estructuras e información subyacente en grandes volúmenes de datos y a construir modelos predictivos escalables. Se pretende que, al finalizar y aprobar el curso, el alumno adquiera una formación integradora de los métodos abordados, comprendiendo sus fundamentos estadísticos y propiedades teóricas, como así también algoritmos eficientes para su uso en la solución de problemas concretos.
Temas principales
- Modelos lineales en regresión. Regresión lineal múltiple.
- Validación cruzada y métodos de remuestreo para selección y validación de modelos.
- Modelos lineales en clasificación. Regresión logística. Análisis discriminante lineal y cuadrático. Curvas ROC.
- Modelos lineales en alta dimensión. Selección por pasos vs regularización. Regresión ridge. Lasso y lasso por grupos. Reducción de dimensiones: regresión parcial y correlaciones canónicas. Análisis de componentes principales (PCA).
- Métodos basados en árboles. Árboles de regresión y de clasificación. Bagging, boosting y random forests.
- Máquinas de vectores soporte para clasificación y regresión.
- Aprendizaje no supervisado: clustering.
- Aprendizaje profundo: Redes neuronales.
Tipo de clases a realizar durante el cursado
- Teórico – Prácticas: 58 h
- Presentación de problemas: 28 h
- Evaluación: 4 h