Detaillierter Kursinhalt
Installationsübersicht (Schnellstart)
- Cloudera Management Console
- CDP-Berechtigungsnachweise
- CDP-Regionen der Kontrollebene
- Registrieren einer CDP-Umgebung
- Cloudera-Datenplattform
- Branchentrends für Big Data
- Die Herausforderung, datengesteuert zu werden
- Die Unternehmensdaten-Cloud
- CDP-Übersicht
- CDP-Formfaktoren
CDP-Architektur
- Übersicht
- Wichtige Konzepte und Komponenten
- CDP-Laufzeitübersicht
- Minimale Hardware
- Ausgehende Verbindungen
Überblick über die Steuerungsebene
- Zugriff und Verwaltung einer Umgebung
- Überblick über die Datenverwaltung
- Management Console
- Dashboard
- Umgebungen
- Daten-Seen
- User Management
- Klassische Cluster
- Daten-Hubs
- Datenkatalog
- Replikations-Manager
- Beobachtbarkeit
CDP CLI (Command Line Interface)
- CDP CLI Befehlszeilenschnittstelle
- Installieren von CDP CLI / CLI Client Setup
- CLI-Module
- Generierung eines API-Zugangsschlüssels / Konfiguration des CDP-Clients
- Anmeldung beim CDP CLI/SDK
- Konfigurieren der automatischen CLI-Vervollständigung / CLI-Referenz / Zugriff auf die CLI-Hilfe
- CDP API Übersicht / CDP SDK für Java Übersicht / CDP curl Übersicht
Verwaltung des CDP-Zugriffs
- Management Console
- User Management
- Maschinenbenutzer erstellen
- Benutzerberechtigungen
- Sync Users
- Gruppen konfigurieren
- Identitätsanbieter
- Rollen und Ressourcen-Rollen
- Globale Einstellungen
- Berechtigungsnachweis für die Datenspeicherung prüfen
Data Hubs Übersicht
- Daten-Hubs
- Planung / Erstellung Ihres Data Hub Clusters
- Allgemeine Planungsüberlegungen
- Knoten konfigurieren
- Verwaltung des Data Hub
- Die Auswahl der richtigen Hardware
- Erweiterte Cluster-Konfiguration
- Data Hub Types
- DataFlow
- Datentechnik
- Fehlersuche
Verwalten von Daten-Hubs
- Bewährte Praktiken für Daten-Hubs
- Sising Data Hubs
- Cloudera-Manager
- Data Hub-Dienste
- Infos zur automatischen Skalierung/Datendrehscheibe
- Überprüfen des Cluster-Gesundheitsstatus / Ereignisse und Warnungen
- Host Wartung
- Aufrüstung eines Data Hub Clusters
- Überwachung / Überwachungsfunktionen
Überblick über die Datendienste
- Überblick über die Datendienste
- Data Services
- Planung Ihres Datenservice-Clusters
- Auswahl der richtigen Hardware / Überlegungen zum Netzwerk
- Erstellen von Datendiensten
- DataFlow
- Datentechnik
- Data Warehouse
- Operative Datenbank
- Maschinelles Lernen
- Fehlersuche
DataFlow
- DataFlow Service Übersicht
- Überblick über den Dateningest
- Einlesen von Daten über Dateiübertragung oder REST-Schnittstellen
- Einlesen von Daten mit NiFi
- Automatische Skalierung
Datentechnik
- Überblick über den Data Engineering Service
- Apache Spark/Flink/Kafka-Streams Übersicht
- Automatische Skalierung
Data Warehouse
- Data Warehouse Service Übersicht
- Hinzufügen und Verwalten eines Datenbankkatalogs
- Hinzufügen und Abstimmen eines virtuellen Lagers
- Abfrage eines Data Warehouse
- Datenvisualisierung
- Überwachung und Fehlerbehebung
Operative Datenbank
- Operativer Datenbankdienst - Überblick
- Apache HBase/Search Überblick
- Automatische Skalierung
Maschinelles Lernen
- Übersicht über den Machine Learning Service
- CML-Motoren
- Anforderungen für CML-Workspaces
- Bereitstellen eines CML-Arbeitsbereichs
- CML-Auto-Skalierung
- Überwachung
Überwachung und Verwaltung
- Überwachung und Verwaltung in der CDP Public Cloud
- Data Lake Cluster-Überwachung und CDP-Auditing
- Erste Schritte bei der Überwachung in CDP
- Überwachung mit Cloudera Manager: Gesundheitstests und Dashboards
- Überwachung von Clustern, Diensten, Hosts, Rollen und Aktivitäten
- Fehlerbehebung bei Cluster-Konfiguration und -Betrieb
Data Management
- SDX - Sicherheit und Governance
- Sicherheitskonzepte
- Zugriff auf Cloud-Speicher
- Data Lake Sicherheit: SDX
- Apache Ranger
- CDP-Autorisierung/Authentifizierung
- Datenverwaltung
- Apache-Atlas
- Datenkatalog
Beobachtbarkeit
- Übersicht
- Unterstützung
- Architektur für die Bereitstellung von Beobachtungsmöglichkeiten
- Überwachungsmöglichkeiten
- Arbeiten mit Warnungen, Kosten und Berichten