Información general


Tipo de asignatura: optativa

Coordinador: Rosa Herrero Antón

trimestre: Segundo trimestre

Créditos: 6

Profesorado: 

Sandra Obiol Madrid

Idiomas de impartición


  • Castellano

La asignatura se impartirá en español. Los alumnos podrán dirigirse al profesor en el idioma que les sea más cómodo. Algunos contenidos, transparencias y bibliografía estarán en inglés.

Competencias


competencias básicas
  • B2_Que los estudiantes sepan aplicar sus conocimientos en su trabajo o vocación de una forma profesional y tengan las competencias que demuestran mediante la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio

  • B3_Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio), para emitir juicios que incluyan una reflexión sobre temas relevantes de carácter social, científico o ético

  • B4_Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tan especializado como no especializado

  • B5_Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía

Descripción


En este curso se introducen los métodos básicos de Clasificación (aprendizaje supervisado) y de Clustering (aprendizaje no supervisado) en el contexto del Big Data. Los estudiantes seguirán un estudio de caso por cada uno de los métodos de aprendizaje con la ayuda de los profesores. Los estudiantes realizarán hasta un total de cuatro prácticas y al final desarrollarán un proyecto que consistirá en el análisis de unos datos utilizando las herramientas vistas durante el curso. Además tendrán que explicar la información que han podido extraer de los datos. El proyecto deberá presentarse de forma oral a un tribunal.

Contenidos


PARTE I

1 Historia de la ciencia de datos. Del Business Intelligence al Big Data

2 Calidad y visualización de los datos. Informes y cuadros de mando

3 Clasificación

3.1 GLM

3.2 Árboles

3.3 Otros métodos

PARTE II

4 Métodos Clustering

4.1 Medidas de distancia

4.2 Kmeans

4.3 Clustering jerárquico

4.4 Modelos de mezcla gaussiana

4.5 Óptica

5 Reglas de Asociación

6 Análisis de texto

7 Sistemas de Recomendación y Aprendizaje por Refuerzo

8 Evaluación del modelo

9 Proyecto

Sistema de evaluación


La nota final se calculará como la media ponderada de las diferentes actividades:

20 % Prueba de clasificación (Examen)

20 % Prueba de clustering (Examen)

45% Proyecto final (con presentación oral)

15% Participación en clase de prácticas.

Sólo se evaluará la asignatura a partir del 80% de la asistencia

recuperación

Se podrá recuperar la parte del proyecto final

Normas de realización de las actividades

Para cada actividad, los docentes informarán de las normas y condiciones particulares que las rijan.

Las actividades unipersonales presuponen el compromiso del estudiante de realizarlas de forma individual. Se considerarán suspendidas todas aquellas actividades en las que el estudiante no se ajuste a este compromiso, independientemente de su papel (emisor o receptor). Igualmente, las actividades que deban realizarse en grupos presuponen el compromiso por parte de los estudiantes que lo integran de realizarlas en el seno del grupo. Se considerarán suspendidas todas aquellas actividades en las que el grupo no haya respetado este compromiso con independencia de su papel (emisor o receptor).

En las actividades realizadas en grupo el docente puede, en base a la información de que disponga, personalizar la calificación para cada integrante del grupo.

Es potestativo de los docentes aceptar o no entregas fuera de los plazos que se indiquen. En caso de que estas entregas fuera de plazo se acepten, es potestativo del docente decidir si aplica alguna penalización y la cuantía de esta

Bibliografía


Básico

Gareth, James y otros autores (2017), An introduction to Statistical Learning: with Applications in R. Springer