In dieser Lehrveranstaltung werden theoretische und praktische Fähigkeiten zur Entwicklung von Big Data Lösungen vermittelt. Den Schwerpunkt in der praktischen Betrachtung bildet dabei das Hadoop Ökosystem, mit Programmiermodellen wie MapReduce, Hive, Pig und Apache Spark.

Im Rahmen der Veranstaltung erlangen Studierende Kenntnisse über:

  • Grundbegriffe, Definitionen, Grundkonzepte rund um Big Data
  • Vertiefung Datenbanktechnologien und -revolutionen: OLTP, OLAP, ETL, NoSQL
  • MapReduce und weitere neue Paradigmen, Hadoop-Ökosystem
  • NoSQL Datenbanken und die zugrundeliegenden Konzepte: Schlüssel-Wert Datenbanken, Dokumenten Datenbanken, Graph-Datenbanken
  • Verteilte Dateisysteme und Konsistenzmodelle
  • Batch- und Stream-Processing, Lambda Architektur

Darüber hinaus erlangen Studierende in Übungen praktische Erfahrungen mit ausgewählten Werkzeugen.