Accelerating CUDA C++ Applications with Multiple GPUs (ACCAMG)

Kursüberblick

Rechenintensive CUDA C++-Anwendungen in den Bereichen High-Performance Computing, Data Science, Bioinformatik und Deep Learning können durch die Verwendung mehrerer GPUs beschleunigt werden, was den Durchsatz erhöhen und/oder die Gesamtlaufzeit verringern kann. In Kombination mit der gleichzeitigen Überlappung von Berechnungen und Speicherübertragungen können Berechnungen über mehrere GPUs skaliert werden, ohne die Kosten für Speicherübertragungen zu erhöhen. Unternehmen mit Multi-GPU-Servern, ob in der Cloud oder auf NVIDIA DGX-Systemen, können mit diesen Techniken Spitzenleistungen bei GPU-beschleunigten Anwendungen erzielen. Und es ist wichtig, diese Single-Node-Multi-GPU-Techniken zu implementieren, bevor Sie Ihre Anwendungen über mehrere Nodes skalieren.

Bitte beachten Sie, dass eine einmal bestätigte Buchung nicht mehr rückerstattet werden kann. Das bedeutet, dass Sie Ihren Platz für eine Veranstaltung nach der Bestätigung nicht mehr stornieren können und keine Rückerstattung erfolgt, unabhängig von der Teilnahme an der Veranstaltung.

Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.

Voraussetzungen

Professionelle Erfahrung in der Programmierung von CUDA C/C++-Anwendungen, einschließlich der Verwendung des nvcc-Compilers, Kernel-Starts, Grid-Stride-Schleifen, Host-to-Device- und Device-to-Host-Speicherübertragungen und CUDA-Fehlerbehandlung
Vertrautheit mit der Linux-Befehlszeile
Erfahrung mit der Verwendung von Makefiles zum Kompilieren von C/C++-Code

Empfohlene Ressourcen, um die Voraussetzungen zu erfüllen: Fundamentals of Accelerated Computing with CUDA C/C++, Ubuntu Command Line for Beginners (Abschnitte 1 bis 5), Makefile Tutorial (durch den Abschnitt Simple Examples)

Kursziele

Verwendung gleichzeitiger CUDA Streams zur Überlappung von Speicherübertragungen und GPU-Berechnungen
Nutzung aller verfügbaren GPUs auf einem einzigen Knoten, um Arbeitslasten auf alle verfügbaren GPUs zu verteilen
Kombinieren Sie die Nutzung von Kopier-/Rechenüberschneidungen mit mehreren GPUs
Nutzen Sie die Zeitleiste des NVIDIA Nsight™ Systems Visual Profiler, um Verbesserungsmöglichkeiten und die Auswirkungen der im Workshop behandelten Techniken zu beobachten

Weiterführende Kurse

Scaling CUDA C++ Applications to Multiple Nodes (SCCAMN)

Preise & Trainingsmethoden

Online Training

Dauer
1 Tag

Preis

500,– €

Termine und Buchen

Termin anfragen

Classroom Training

Dauer
1 Tag

Preis

Deutschland: 500,– €

Termine und Buchen

Termin anfragen

Derzeit gibt es keine Trainingstermine für diesen Kurs.

Termin anfragen