Información general


Tipo de asignatura: optativa

Coordinador: Alfonso Palacios González

trimestre:3

Créditos: 6

Profesorado: Alfonso Palacios González

Descripción


Optativa para conocer las tendencias en el tratamiento de las
datos en los campos del Big Data y el Open Data:
– open data, linked data y controlled vocabularias
– web of data
– big data y big data engineering
• Con bases de datos relacionales
• Con bases de datos y datastoras NoSQL

Resultados de aprendizaje


A nivel general, esta asignatura contribuye a los siguientes resultados de aprendizaje especificados para la materia de Ingeniería del software en la que
debe asociarse como optativa:
(RA1) Utilizar de forma apropiada teorías, procedimientos y herramientas en el desarrollo profesional de la ingeniería informática en todos sus
ámbitos (especificación, diseño, implementación, despliegue -implantación- y evaluación de productos) de modo que se demuestre la
comprensión de los compromisos adoptados en las decisiones de diseño.
(RA2) Tomar iniciativas que generen oportunidades, nuevos objetos o soluciones nuevas, con una visión de implementación de proceso y de
mercado, y que implique y haga partícipes a los demás en proyectos a desarrollar (capacidad de actuar de manera autónoma).
(RA3) Especificar, diseñar, implementar, gestionar y mantener sistemas y servicios software complejos y/o críticos.
(RA4) Evaluar y seleccionar plataformas de producción hardware y software para la ejecución de aplicaciones y servicios informáticos.
(RA5) Evaluar sistemas hardware/software en función de un criterio de calidad determinado.
(RA6) Determinar los factores que inciden negativamente en la seguridad y la fiabilidad de un sistema hardware/software, minimizando sus efectos.
(RA7) Identificar tecnologías actuales y emergentes y evaluar si son aplicables, y en qué medida, para satisfer las necesidades de los usuarios.
(RA8) Diseñar soluciones que integren tecnologías de hardware, software y comunicaciones (y capacidad de desarrollar soluciones específicas de
software de sistemas) para sistemas distribuidos y dispositivos de computación ubicua.
(RA9) Comprender y utilizar eficazmente manuales, especificaciones de productos y otra información de carácter técnico escrita en inglés.

Metodología de trabajo


El enfoque metodológico de la asignatura es una colección de workshops con los que introducirse y probar diferentes tecnologías en el tratamiento de datos
masivas y/o abiertas
Para cada workshop:
Se realiza una introducción el día interior y se presenta el trabajo a realizar a lo largo de la semana antes del día del workshop
El día del workshop deben realizarse una serie de tareas que pueden ser de instalación, introducción de datos, programación, recuperación de datos y
administración de los diferentes sistemas
Al comienzo del siguiente día se realiza una prueba de validación de la consecución de conocimientos
A elegir en cada edición de la asignatura entre cinco y diez workshops entre:

  • Big and Data Open Engineering: an Introduction
  • Open and Linked Data
  • RDF store, Web of Data and controlled vocabularias
  • Fecha Warehousing/BI techniques and ETL Processes
  • Big Data Storage with Relational Databases (Oracle 19c o PostgreSQL)
  • Big Data with Wide Column Store (Apache Cassandra o DataStax Enterprise)
  • Big Data with Key-value Storage (Redis / RedisLabs)
  • Big Data with Document Store (MongoDB)
  • Big Data Enginering and Architecture with (Apache Hadoop / Apache Spark / Cloudera)
  • Big Data with search engines (ElasticSearch)

 

contenidos


La asignatura es una cata de tecnologías usadas en el campo de los datos masivos y/o abiertos.

1. Introducción a los conceptos Big /Open Data
2. Open Data, Linked Open Data and controlled vocabularias
3. RDF Store, Web of Data and Semantic Web
4. Big data con sistemas gestores de bases de datos relacionales
5. DataWarehousing, Business Intelligence y procesos ETL
6. Big data con sistemas NoSQL de almacenamiento de datos, modelo key-value (como Redis)
7. Big data con sistemas NoSQL de almacenamiento de datos, modelo wide-column (como Cassandra)
8. Big data con sistemas NoSQL de almacenamiento de datos, modelo document-store (como MongoDB)
9. Big data, entornos de desarrollo para Data Science y Data Analysis

Actividades de aprendizaje


Cinco/Diez workshops de cuatro/ocho horas entre estos:
– B&ODE an introduction
– Web of data and semantic web technology
– Linked Open Data and controlled vocabularias
– Big data with RDBMS storage
– DataWarehousing, Business Intelligence and ETL procesas
– Big data with wide column storage (Apache Cassandra)
– Big data with key value storage (Redis)
– Big data with document storage (MongoDB)
– Big data with search engines (ElasticSearch)
– Big data, a development environment for data science (Apache Hadoop, Apache Spark, Cloudera)
Cada workshop tiene una serie de tareas a desarrollar en clase que son evaluadas
Cada workshop tiene una prueba de evaluación
Existe un examen final para aquellos estudiantes que no hayan superado el curso a partir de las calificaciones de los workshops
Cada workshop colabora en los resultados de aprendizaje RA1..RA9 en el campo del almacenamiento masivo, abierto y entrelazado de los datos
Cada workshop colabora en las siguientes competencias:
(B2): aplicando los conocimientos adquiridos a lo largo del grado para poder tomar decisiones en el campo de los datos masivos, abiertos e interoperables
(B3): haciendo un juicio sobre las implicaciones sociales y éticas -tanto positivas como negativas- de la recolección masiva de datos, de la apertura y la
transparencia de los datos públicos y de las ventajas e inconvenientes de la interoperabilidad de los datos
(B5): proporcionando un bagaje que permita profundizar al estudiante en una o más de las tecnologías presentadas a lo largo de su carrera
educadores
(T1): usando documentación inglesa
(CIN1): evaluando sistemas de almacenamiento de datos
(CIN2): evaluando el impacto económico, social y ético de los sistemas abiertos y/o masivos de datos
(CIN4): conociendo las tecnologías emergentes en las ingenierías de datos para tomar decisiones en la construcción de sistemas de información
(CIN5): conociendo aspectos de la administración y el mantenimiento de grandes sistemas de almacenamiento de datos
(CIN12): conociendo las últimas tendencias y las tecnologías emergentes en el campo de las bases de datos
(CIN13): conociendo sistemas de programación, introducción y recuperación de datos en sistemas de datos emergentes para datos masivos, abiertos y
interoperable
(CIN14): probando sistemas de distribución y de replicación de datos
(ESI4): disponiendo de criterio para poder tomar o comprender decisiones sobre tecnologías de ingeniería de datos

Sistema de evaluación


Cada workshop representa el 5% (si son diez) de la nota de la asignatura, un 50% en total. Se evalúa el trabajo previo y el trabajo realizado en clase.
El examen final representa el otro 50% de la asignatura. Otra forma de realizarlo es superar las diez pruebas de validación de los diez workshops.

Bibliografía


básico

Allemang, Dean; Hendler, James; Gandon, Fabien. "Semántica Web para la Working Ontologist: Effective Modeling in RDFS and OWL". Third Edition. ACM Books, 2020. ISBN 978-1450376143

Antoniou, Grigoris; Groth, Paul; van Harmelen, Frank; Hoekstra, Rinke: "En Semantic Web Primero". Third Edition. The MIT Press, 2012. ISBN
9780262018289.
 

Da Silva, Maxwell Dayvson; Tavares, Hugo Lopes "Redis Essentials". Packt Publishing, 2015. ISBN: 9781784392451.

 

Brown, Mat "Learning Apache Cassandra" . Packt Publishing, 2015. ISBN: 9781783989201.

 

Bradshaw, Shannon; Chodorow, Kristina "MongoDB: The Definitive Guide". Third Edition. O'Reilly, 2019. ISBN: 978-1491954461.
 

W3C (World Wide Web Consortium): W3C's website on Web of Data. (last visited September'2021) https://www.w3.org/2013/data/