Información general


Tipo de asignatura: optativa

Coordinador: Vladimir Bellavista Pariente

trimestre: Segundo trimestre

Créditos: 6

Profesorado: 

Sandra Obiol Madrid

Curso académico: 2025

Curso de impartición: 4

Lenguas de impartición


  • Catalá

La asignatura se impartirá en catalán. Los alumnos podrán dirigirse al profesor en el idioma que les sea más cómodo. Algunos contenidos, transparencias y bibliografía estarán en inglés.

Competencias / Resultados de aprendizaje


competencias básicas
  • B2_Que los estudiantes sepan aplicar sus conocimientos en su trabajo o vocación de una forma profesional y tengan las competencias que demuestran mediante la elaboración y defensa de argumentos y la resolución de problemas dentro de su área de estudio

  • B3_Que los estudiantes tengan la capacidad de reunir e interpretar datos relevantes (normalmente dentro de su área de estudio), para emitir juicios que incluyan una reflexión sobre temas relevantes de carácter social, científico o ético

  • B4_Que los estudiantes puedan transmitir información, ideas, problemas y soluciones a un público tan especializado como no especializado

  • B5_Que los estudiantes hayan desarrollado aquellas habilidades de aprendizaje necesarias para emprender estudios posteriores con un alto grado de autonomía

Presentación de la asignatura


En este curso se introducen los métodos básicos de Clasificación (aprendizaje supervisado) y de Clustering (aprendizaje no supervisado) en el contexto del Big Data. Los estudiantes seguirán un estudio de caso por cada uno de los métodos de aprendizaje con la ayuda del profesor. Los estudiantes desarrollarán un proyecto que consistirá en el análisis de unos datos utilizando las herramientas vistas durante el curso. Además tendrán que explicar la información que han podido extraer de los datos. El proyecto deberá presentarse de forma oral en clase.

Contenidos


PARTE I

1 Historia de la ciencia de datos. Del Business Intelligence al Big Data

2 Calidad y visualización de los datos. Informes y cuadros de mando

3 Clasificación

3.1 GLM

3.2 Árboles

3.3 Otros métodos

PARTE II

4 Métodos Clustering

4.1 Medidas de distancia

4.2 Kmeans

4.3 Clustering jerárquico

4.4 Modelos de mezcla gaussiana

4.5 Óptica

5 Reglas de Asociación

6 Análisis de texto

7 Sistemas de Recomendación y Aprendizaje por Refuerzo

8 Evaluación del modelo

9 Proyecto

Actividades y sistema de evaluación


La nota final se calculará como la media ponderada de las distintas actividades:

  • 20 % Prueba de clasificación (Examen)
  • 20 % Prueba de clustering (Examen)
  • 45% Proyecto final (con presentación oral)
  • 15% Participación en las clases de prácticas.

Sólo se evaluará la asignatura si se cumple más del 80% de asistencia.

recuperación

Se podrá recuperar la parte del proyecto final.

Normas de realización de las actividades

Para cada actividad, el profesorado informará de las normas y condiciones particulares que la rijan. Las actividades unipersonales presuponen el compromiso del estudiante de realizarlas de forma individual. Se considerarán suspendidas todas aquellas actividades en las que el estudiante no se ajuste a este compromiso, independientemente de su papel (emisor o receptor). Igualmente, las actividades que deban realizarse en grupo presuponen el compromiso por parte de los estudiantes que lo integran de llevarlas a cabo dentro del grupo. Se considerarán suspendidas todas aquellas actividades en las que el grupo no haya respetado este compromiso, con independencia de su papel (emisor o receptor). En las actividades realizadas en grupo, el profesor podrá, en base a la información de que disponga, personalizar la calificación para cada integrante del grupo.

Es potestativo del profesorado aceptar o no entregas fuera de los indicados plazos. En caso de que estas entregas fuera de plazo se acepten, es potestativo del profesor decidir si aplica alguna penalización y su cuantía.

Uso de la Inteligencia Artificial Generativa

El uso de inteligencias artificiales generativas (IAGs) debe limitarse a aquellos aspectos que no son fundamentales en el contexto de la asignatura. Se pueden utilizar, de forma crítica, como mecanismo para resolver dudas sobre la materia y/o para mejorar la redacción de documentos entregables y/o como ayuda en la generación de código de carácter auxiliar que queda fuera del alcance de los temas de la asignatura. En el segundo caso (mejora de la redacción) será necesario explicitar en el documento la participación de IAG en la redacción. En el último caso (generación de código) será imprescindible mencionar su naturaleza de “generado mediante IAG” explicitando su modelo utilizado y el prompt suministrado, incluso si ha sido posteriormente personalizado y/o modificado. Las IAG no podrán ser utilizadas para generar código de programación, ni siquiera en forma de fragmentos, cuando este código quede dentro del alcance de los temas de la asignatura y/o tenga carácter evaluable. Esta prohibición se mantendrá incluso si el código es posteriormente personalizado y/o modificado. Ante las dudas respecto a la legitimidad o no de la utilización de IAGs es necesario contactar, a priori, con el profesorado de la asignatura. 

Bibliografía


Básico

Gareth, James y otros autores (2017), An introduction to Statistical Learning: with Applications in R. Springer