Guía docente de Minería de Datos: Aspectos Avanzados (M51/56/3/23)
Máster
Módulo
Rama
Centro Responsable del título
Semestre
Créditos
Tipo
Tipo de enseñanza
Profesorado
- Alberto Luis Fernández Hilario
- Salvador García López
- Siham Tabik Ouled Hrour
Tutorías
Alberto Luis Fernández Hilario
Email- Tutorías 1º semestre
- Lunes 10:00 a 12:00 (Mect (Fciencia))
- Miércoles 9:30 a 11:30 (Mect (Fciencia))
- Jueves 10:00 a 12:00 (Mect (Fciencia))
- Tutorías 2º semestre
- Miércoles 10:00 a 13:00 (D16 (Etsiit))
- Jueves 10:00 a 13:00 (D16 (Etsiit))
Salvador García López
Email- Tutorías 1º semestre
- Lunes 9:30 a 11:30 (Mect (Fciencia))
- Lunes 16:30 a 18:30 (D 26 (Etsiit))
- Jueves 9:30 a 11:30 (Mect (Fciencia))
- Tutorías 2º semestre
- Martes 9:00 a 12:00 (D26 (Etsiit))
- Jueves 9:00 a 12:00 (D26 (Etsiit))
Siham Tabik Ouled Hrour
Email- Tutorías 1º semestre
- Miércoles 11:00 a 13:00 (Nd (Etsiit))
- Viernes 9:00 a 11:00 (Nd (Etsiit))
- Tutorías 2º semestre
- Lunes 15:30 a 17:30 (Nd (Etsiit))
- Miércoles 15:30 a 17:30 (Nd (Etsiit))
- Jueves 15:30 a 17:30 (Nd (Etsiit))
Breve descripción de contenidos (Según memoria de verificación del Máster)
Aspectos Avanzados en Clasificación y problemas singulares:
- Clasificación no balanceada
- Clasificación ordinal y monótona
- Aprendizaje multi-salida
- AutoML
Aprendizaje no supervisado y semi-supervisado:
- Aprendizaje Semi-Supervisado
- Aprendizaje Auto-Supervisado
- Deep Learning
Prerrequisitos y/o Recomendaciones
Se recomienda haber cursado las asignaturas siguientes:
- "Minería de Datos: Preprocesamiento y Clasificación".
- "Técnicas de Soft Computing"
- "Visión por Computador"
Competencias
Competencias Básicas
- CB6. Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación.
- CB7. Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio.
- CB8. Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios.
- CB9. Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan a públicos especializados y no especializados de un modo claro y sin ambigüedades.
- CB10. Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
Resultados de aprendizaje (Objetivos)
El alumno aprenderá cómo resolver problemas complejos en minería de datos cuando los tipos de datos originales o el tipo de información a extraer requieren el uso de técnicas específicas para su resolución.
En concreto, aprenderán algoritmos y técnicas para la obtención de modelos de aprendizaje en los siguientes problemas:
- Aquéllos en que cada dato se puede corresponder con más de una clase;
- Cuando los valores de las clases no se encuentran uniformemente distribuidos en el conjunto de entrenamiento y hay un gran desequilibrio en cuanto a la frecuencia de aparición de algunas de ellas;
- Casos de estudio en que se debe tener en cuenta un orden establecido a priori en los valores de las clases;
- Datos que no son vectores de valores sino conjuntos de vectores que son etiquetados de forma global con un valor de clase, aunque localmente puedan tener otros valores de clase asignados distintos.
- Problemas de alta dimensionalidad, especialmente basados en imágenes y multimedia, por ejemplo, utilizando extracción de características y clasificación con arquitecturas basadas en redes neuronales artificiales profundas (Deep Learning).
Programa de contenidos Teóricos y Prácticos
Teórico
Problemas Singulares en Aprendizaje Supervisado:
- Clasificación no balanceada
- Aprendizaje Multi-salida (Multi-label, multi-target, label-distribution learning)
- Aprendizaje Multi-instancia
- Clasificación ordinal y monótona
- Aprendizaje Semi-Supervisado
Aprendizaje Profundo (Deep Learning) y nuevas tendencias de aprendizaje
- Aprendizaje Automático Automatizado (AutoML)
- Aprendizaje Federado (Federated Learning)
- Transferencia de aprendizaje (Transfer Learning)
- Aprendizaje con pocas instancias (Few-shot learning)
- Aprendizaje auto-supervisado (Self-supervised Training)
- Desarrollos recientes
Práctico
Talleres de realización de ejercicios concretos en diferentes problemas estudiados:
- Aprendizaje con clases no balanceadas.
- Aprendizaje semi-supervisado.
- Clasificación de imágenes mediante técnicas de Deep Learning avanzadas
Bibliografía
Bibliografía fundamental
- Alberto Fernández, Salvador García, Mikel Galar, Ronaldo. C. Prati, Bartoscz Krawczyk, Francisco Herrera. Learning from Imbalanced Data Sets. Springer, 2018.
- Pang-Ning Tan, Michael Steinbach & Vipin Kumar: "Introduction to Data Mining," 2nd edition. Addison-Wesley, 2014. ISBN 978-0133128901.
- Ian Goodfellow, Yoshua Bengio, Aaron Courville: “Deep Learning”, MIT Press, 2016. ISBN: 9780262337434.
- F. Hutter, L. Kotthoff, J. Vanschoren: "Automated Machine Learning. Methods, Systems, Challenges". Springer 2019. ISBN 978-3-030-05317-8.
- Balestriero, R., Ibrahim, M., et al. (2023). A cookbook of self-supervised learning. arXiv preprint arXiv:2304.122
- Aurélien Géron: “Hands-on machine learning with scikit-learn and tensorflow”. O’reilly, 2017.ISBN-10: 149196229.
Bibliografía complementaria
- Mohammed J. Zaki & Wagner Meira, Jr.: "Data Mining and Analysis: Fundamental Concepts and Algorithms." Cambridge University Press, 2014. ISBN 978-0521766333.
- Anand Rajaraman, Jure Leskovec & Jeffrey D. Ullman: "Mining of Massive Datasets." Cambridge University Press, 2011-2014. ISBN 978-1107015357.
- Jiawei Han, Micheline Kamber & Jian Pei: "Data Mining: Concepts and Techniques," 3rd edition. Morgan Kaufmann Publishers, 2011. ISBN 978-0123814791.
- Francisco Herrera, Sebastián Ventura, Rafael Bello, Chris Cornelis, Amelia Zafra, Dánel Sánchez-Tarragó, Sarah Vluymans. Multiple Instance Learning: Foundations and Algorithms. Springer, 2016.
- Francisco Herrera, Francisco Charte, Antonio Jesús Rivera, María José del Jesus. Multilabel Classification: Problem Analysis, Metrics and Techniques. Springer, 2016.
- José Ramón Cano, Pedro Antonio Gutiérrez, Bartoscz Krawczyk, Michal Wozniak, Salvador García. Monotonic classification: An overview on algorithms, performance measures and data sets. Neurocomputing 341, 168-182 (2019).
- Y. Jin, H. Zhu, J. Xu, Y. Chen. Federated Learning: Fundamentals and Advances. Springer 2023. ISBN: 978-981-19-7082-5
Enlaces recomendados
- Página web del Máster Universitario Oficial en Ciencia de Datos e Ingeniería de Computadores: http://masteres.ugr.es/datcom.
- Plataforma de Recursos de Apoyo a la Docencia - PRADO: https://prado.ugr.es
- Departamento de Ciencias de la Computación e Inteligencia Artificial: https://decsai.ugr.es
- Plataformas Kaggle (https://www.kaggle.com/) y DrivenData (https://www.drivendata.org/).
Metodología docente
Evaluación (instrumentos de evaluación, criterios de evaluación y porcentaje sobre la calificación final.)
Evaluación Ordinaria
El artículo 17 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que la convocatoria ordinaria estará basada preferentemente en la evaluación continua del estudiante, excepto para quienes se le haya reconocido el derecho a la evaluación única final.
La metodología de evaluación por defecto según la normativa de la Universidad de Granada es la evaluación continua, que en el caso de esta asignatura se compone de los siguientes elementos:
- Evaluación de la Parte Teórica (50% sobre la nota final): examen final escrito tipo test multirespuesta sobre la temática y contenidos propios de la asignatura.
- Evaluación de la Parte Práctica (50% sobre la nota final): se realizarán prácticas de laboratorio con resolución de problemas de carácter individual y desarrollo de proyectos en grupo. Se valorarán las entregas de los informes/memorias realizados/as por los alumnos.
Evaluación Extraordinaria
El artículo 19 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que los estudiantes que no hayan superado la asignatura en la convocatoria ordinaria dispondrán de una convocatoria extraordinaria. A ella podrán concurrir todos los estudiantes, con independencia de haber seguido o no un proceso de evaluación continua. De esta forma, el estudiante que no haya realizado la evaluación continua tendrá la posibilidad de obtener el 100% de la calificación mediante la realización de una prueba y/o trabajo.
En las convocatorias extraordinarias se utilizará el mismo procedimiento de evaluación que en la evaluación única final, tal y como se describe en el siguiente apartado.
Evaluación única final
El artículo 8 de la Normativa de Evaluación y Calificación de los Estudiantes de la Universidad de Granada establece que podrán acogerse a la evaluación única final, el estudiante que no pueda cumplir con el método de evaluación continua por causas justificadas.
Para acogerse a la evaluación única final, el estudiante, en las dos primeras semanas de impartición de la asignatura o en las dos semanas siguientes a su matriculación si ésta se ha producido con posterioridad al inicio de las clases, lo solicitará, a través del procedimiento electrónico, a la Coordinación del Máster, quien dará traslado al profesorado correspondiente, alegando y acreditando las razones que le asisten para no poder seguir el sistema de evaluación continua.
La evaluación en tal caso consistirá en:
- Evaluación de la Parte Teórica (70% de la calificación): exámenes finales o parciales, sesiones de evaluación y entregas de ejercicios sobre el desarrollo y los resultados de las actividades propuestas.
- Evaluación de la Parte Práctica (30% de la calificación): se realizarán resolución de problemas y desarrollo de proyectos individuales. Se valorarán las entregas de los informes/memorias realizados por los estudiantes, así como su posible defensa.
La evaluación consistirá en realizar el cuestionario teórico, más las trabajos teórico/prácticos similares a los que se llevan en evaluación ordinaria, pero considerando un trabajo individual, autónomo, compensado y reducido por ello.