Weiterbildung

 

Kurs 2: Big Data Modellierung Management-Systeme

Sobald Sie ein Big Data Geschäftsfall identifiziert haben. Wie analysieren Sie den Geschäftsfall? Wie sammeln, speichern und organisieren Sie Ihre Daten am Beispiel einer Big Data-Lösung?

 

In diesem Kurs lernen Sie verschiedene Datengruppen und Management-Tools kennen, die für jedes Unternehmen geeignet sind.

Sie sind in der Lage, die sich entwickelnde Fülle neuer, grosser Datenplattformen aus der Perspektive grosser Datenmanagementsysteme und Analysewerkzeuge zu beschreiben und zu begründen.

 

Durch geführte Hands-On Übungen werden Sie sich mit Techniken vertraut, die Echtzeit- und halbstrukturierte Datenbeispiele verwenden. Es werden folgende Systeme und Werkzeuge diskutiert AsterixDB, HP Vertica, Impala, Neo4j, Redis, SparkSQL.

 

Dieser Kurs zeigt Techniken auf, wie Sie Mehrwert aus bestehenden ungenutzten Datenquellen extrahieren und neue Datenquellen entdecken.

 

Im Teil 2  lernen Sie, wie man in R programmiert und wie man R für eine effektive Datenanalyse einsetzt. Sie lernen, wie Sie Software installieren und konfigurieren, die für eine statistische Programmierumgebung erforderlich ist, und beschreibt generische Programmiersprachenkonzepte, wie sie in einer hochrangigen statistischen Sprache implementiert sind. Der Kurs behandelt praktische Fragen im statistischen Rechnen, die die Programmierung in R, das Lesen von Daten in R, den Zugriff auf R-Pakete, das Schreiben von R-Funktionen, das Debugging, das Refactoring des R-Codes und das Organisieren und Kommentieren des R-Codes beinhaltet. Es werden in den Themen der statistischen Datenanalyse konkrete Arbeitsbeispiele gegeben.

Kurs B

 

Organisation

Dauer10 Halbtage (40 Lektionen)
Durchführung:wöchentlich
Lehrgänge:1-2 mal jährlich
HeimstudiumAls Vorbereitung- und Vertiefung sind 6-8 Stunden pro Ausbildungseinheit einzurechnen

Kurskosten

Einschreibegebühr 170.-
Kurskosten1'880.-
Lehrmittelinkl.

Nutzen/Lernziele

Nach der Teilnahme dieses Kurses sind Sie in der Lage:

  • die Big Data Landschaft anhand Beispielen in der realen Welt, einschliesslich der drei wichtigsten Quellen für Big Data: Menschen, Organisationen und Sensoren zu beschreiben
  • Verschiedene Datenelemente bei Ihrer eigenen Arbeit und in Ihren alltäglichen Geschäftsfällen zu erkennen
  • Erklären, warum Ihr Team einen grossen Dateninfrastrukturplan und ein Informationssystem- Design entwerfen muss 
  • die häufigsten Datenoperationen zu identifizieren, die für die verschiedenen Arten von Daten erforderlich sind
  • ein geeignetes Datenmodell zu wählen, um die Eigenschaften Ihrer Daten anzupassen 
  • Techniken zu entwickeln, um Streaming-Daten zu behandeln 
  • Unterschiede zwischen einem traditionellen Datenbank-Management-System und einem Big Data Management System zu kennen.
  • zu wissen, warum es so viele Daten-Management-Systeme gibt. 
  • Praxis: Entwerfen Sie eine Big Data Lösung für eine Online-Spielfirma.

Voraussetzung

  • Besuch Kurs: Einführung in Big Data—Basis und Grundlagen

  • Kenntnisse im Umgang mit virtuellen Maschinen

  • Hardwareanforderungen:
    Quad Core Prozessor (VT-x oder
    AMD-V Unterstützung empfohlen),
    64-Bit; (B) 8 GB RAM; (C)
    20 GB Festplatte frei

  • Softwareanforderungen:
    diverse kostenlose Open-Source-Tools (werden im Unterricht bereitgestellt)


Um sicherzustellen, dass der von Ihnen vorgesehene Ausbildungsweg wirklich Ihren Bedürfnissen entspricht, bieten wir eine kostenlose und unverbindliche Ausbildungsberatung an.

Einen Termin für ein Beratungsgespräch können Sie gerne telefonisch unter 031 398 98 00 oder direkt auf unserer Webseite vereinbaren.

Modulübersicht

Teil 1: Big Data

Block 1

Einführung in die Big Data Modeling und Management.

Modellieren und Verwalten von Daten steht im Mittelpunkt aller Big Data Projekte. In diesen Lektionen stellen wir Ihnen die Konzepte hinter der Big Data Modellierung und dem Big Data Management vor und bereiten die Bühne für den Rest des Kurses vor.

 

Block 2

Big Data Modellierung Teil 1

Die Modellierung von Daten hängt von vielen Faktoren ab, einschließlich der Datenstruktur, welche Operationen auf den Daten durchgeführt werden können und welche Einschränkungen auf die Modelle gesetzt werden. In diesen Lektionen lernen Sie die Details über Big Data Modellierung und Sie erhalten die praktischen Fähigkeiten, die Sie für die Modellierung Ihrer eigenen Big Data Projekte benötigen.

 

Block 3

Big Data Modellierung Teil 2

Diese Unterrichtsstunden vertieft Big Data Modellierung  mit spezifischen Ansätzen, einschließlich Vektorraummodellen, Graphendatenmodellen und vieles mehr.

 

Block 4

Arbeiten mit Datenmodellen

Datenmodelle befassen sich mit vielen verschiedenen Arten von Datenformaten. Streaming-Daten werden immer allgegenwärtiger, und die Arbeit mit Streaming-Daten erfordert einen anderen Ansatz als die Arbeit mit statischen Daten. In diesen Lektionen werden Sie praktische Erfahrungen sammeln mit verschiedenen Formen von Streaming-Daten einschließlich Wetterdaten und Twitter-Feeds.

 

Block 5

Big Data Management: Das "M" im DBMS

Das Verwalten von vielen Daten erfordert einen unterschiedlichen Ansatz für Datenbankmanagementsysteme aufgrund der großen Variation der Datenstrukturen, die sich nicht für herkömmliche DBMS eignen. Es gibt viele Anwendungen, die zur Verfügung stehen, um mit Big Data-Management zu helfen. In diesen Lektionen stellen wir Ihnen einige dieser Anwendungen vor und geben Einblick in wie und wann sie für Ihre eigenen Big Data Management-Herausforderungen geeignet sind

 

Block 6

Entwerfen eines Big Data Management Systems für ein Online Game

In diesen Lektionen geben wir Ihnen die Gelegenheit, mittels Big Data Modellierung und -verwaltung mit einem fiktiven Online-Spiel namens "Catch the Pink Flamingo" zu lernen.

 

Teil 2: Data Science

Block 7

Hintergrund, Erste Schritte und Grundlagen von R

Das Material aus dem Grundlagen Modul enthält Informationen zur Installation von R. Dieser Block  deckt die grundlegenden Datentypen in R ab, und beschreibt einfache Funktionen zum Lesen und Schreiben von Daten. Ich empfehle Ihnen, die Blöcke in Reihenfolge abzuarbeiten

 

Block 8

Kontrollstrukturen und komplexere Funktionen von R

Deckt wichtige Themen wie Kontrollstrukturen und komplexere Funktionen ab. Wir stellen auch die erste Programmieraufgabe für das Modul vor, das am Ende der Woche fällig ist.

 

Block 9

Schleife-Funktionen und Debugging-Tools in R

Die Vorlesungen in diesem Block decken Schleife Funktionen und die Debugging-Tools in R ab. Diese Aspekte von R machen R nützlich für interaktive Arbeit und Schreiben von längerem Code, und so werden sie häufig in der Praxis verwendet.

 

Block 10

Simulation von Daten in R , Optimierung von Programmen mit dem Profiler

In diesem Block werden die Daten in R simuliert, die als Grundlage für Studienarbeit dient. Wir decken auch den Profiler in R ab, mit dem Sie detaillierte Informationen darüber erhalten können, wie Ihre R-Funktionen laufen und um Engpässe zu identifizieren. Sowie diese Funktionen angesprochen werden können. Der Profiler ist ein wichtiges Hilfsmittel bei der Optimierung Ihrer Programme. Schließlich decken wir die str-Funktion ab, die wir persönlich für die nützlichste Funktion in R. halten.