Informació general


Tipus d'assignatura: Optativa

Coordinador: Rosa Herrero Antón

Trimestre: Segon trimestre

Crèdits: 6

Professorat: 

Sandra Obiol Madrid

Curs acadèmic: 2025

Curs d'impartició: 4

Llengües d'impartició


  • Català

L'assignatura s'impartirà en català. Els alumnes podran adreçar-se al professor en l'idioma que els sigui més còmode. Alguns continguts, transparències i bibliografia estaran en anglès.

Competències / Resultats d'aprenentatge


Competències bàsiques
  • B2_Que els estudiants sàpiguen aplicar els seus coneixements a la seva feina o vocació d'una forma professional i tinguin les comptències que demostren mitjançant l'elaboració i defensa d'arguments i la resolució de problemes dins de la seva àrea d'estudi

  • B3_Que els estudiants tinguin la capacitat de reunir i interpretar dades rellevants (normalment dins de la seva àrea d'estudi), per emetre judicis que incloguin una reflexió sobre temes rellevants de caire social, científica o ètica

  • B4_Que els estudiants puguin transmetre informació, idees, problemes i solucions a un públic tan especialitzat com no especialitzat

  • B5_Que els estudiants hagin desenvolupat aquelles habilitats d'aprenentatge necessàries per emprendre estudis posteriors amb un alt grau d'autonomia

Presentació de l'assignatura


En aquest curs s'introdueixen els mètodes bàsics de Classificació (aprenentatge supervisat) i de Clustering (aprenentatge no supervisat) en el context del Big Data. Els estudiants seguiran un estudi de cas per cadascun dels mètodes d'aprenentatge amb l'ajuda del professor. Els estudiants desenvoluparan un projecte que consistirà en l'anàlisi d'unes dades emprant les eines vistes durant el curs. A més hauran d'explicar la informació que han pogut extreure de les dades. El projecte s'haurà de presentar de forma oral a classe.

Continguts


PART I

1 Història de la ciència de dades. Del Business Intelligence al Big Data

2 Qualitat i visualització de les dades. Informes i quadres de comandament

3 Classificació

3.1 GLM

3.2 Arbres

3.3 Altres mètodes

PART II

4 Mètodes Clustering

4.1 Mesures de distància

4.2 Kmeans

4.3 Clustering jeràrquic

4.4 Gaussian Mixture Models

4.5 Optics

5 Regles d'Associació

6 Anàlisi de text

7 Sistemes de Recomanació i Aprenentatge per Reforç

8 Avaluació del model

9 Projecte

Activitats i sistema d'avaluació


La nota final es calcularà com la mitjana ponderada de les diferents activitats:

  • 20 % Prova de classificació (Examen)
  • 20 % Prova de clustering (Examen)
  • 45 % Projecte final (amb presentació oral)
  • 15 % Participació en les classes de pràctiques.

Només s’avaluarà l’assignatura si es compleix més del 80 % d’assistència.

Recuperació

Es podrà recuperar la part del projecte final.

Normes de realització de les activitats

Per a cada activitat, el professorat informarà de les normes i condicions particulars que la regeixin. Les activitats unipersonals pressuposen el compromís de l’estudiant de realitzar-les de manera individual. Es consideraran suspeses totes aquelles activitats en què l’estudiant no s’ajusti a aquest compromís, independentment del seu paper (emissor o receptor). Igualment, les activitats que s’hagin de realitzar en grup pressuposen el compromís per part dels estudiants que l’integren de dur-les a terme dins del grup. Es consideraran suspeses totes aquelles activitats en què el grup no hagi respectat aquest compromís, amb independència del seu paper (emissor o receptor). En les activitats realitzades en grup, el professor podrà, basant-se en la informació de què disposi, personalitzar la qualificació per a cada integrant del grup.

És potestatiu del professorat acceptar o no entregues fora dels terminis indicats. En cas que aquestes entregues fora de termini s’acceptin, és potestatiu del professor decidir si aplica alguna penalització i la seva quantia.

Ús de la Intel·ligència Artificial Generativa

L’ús d’intel·ligències artificials generatives (IAGs) s’ha de limitar a aquells aspectes que no són fonamentals en el context de l’assignatura. Es poden utilitzar, de manera crítica, com a mecanisme per a resoldre dubtes sobre la matèria i/o per a millorar la redacció de documents lliurables i/o com ajut en la generació de codi de caràcter auxiliar que queda fora de l’abast dels temes de l’assignatura. En el segon cas (millora de la redacció) caldrà explicitar en el document la participació d’IAG en la redacció. En el darrer cas (generació de codi) serà imprescindible esmentar la seva naturalesa de “generat mitjançant IAG” explicitant-ne el model utilitzat i el prompt subministrat, fins i tot si ha estat posteriorment personalitzat i/o modificat. Les IAGs no podran ser utilitzades per a generar codi de programació, ni tan sols en forma de fragments, quan aquest codi quedi dins de l’abast dels temes de l’assignatura i/o tingui caràcter avaluable. Aquesta prohibició es manté fins i tot si el codi és posteriorment personalitzat i/o modificat. Davant dels dubtes respecte de la legitimitat o no de la utilització d’IAGs cal contactar, a priori, amb el professorat de l’assignatura. 

Bibliografia


Bàsic

Gareth, James y otros autores (2017), An introduction to Statistical Learning: with Applications in R. Springer