Accelerating CUDA C++ Applications with Multiple GPUs (ACCAMG)

 

Kursüberblick

Rechenintensive CUDA C++-Anwendungen in den Bereichen High-Performance Computing, Data Science, Bioinformatik und Deep Learning können durch die Verwendung mehrerer GPUs beschleunigt werden, was den Durchsatz erhöhen und/oder die Gesamtlaufzeit verringern kann. In Kombination mit der gleichzeitigen Überlappung von Berechnungen und Speicherübertragungen können Berechnungen über mehrere GPUs skaliert werden, ohne die Kosten für Speicherübertragungen zu erhöhen. Unternehmen mit Multi-GPU-Servern, ob in der Cloud oder auf NVIDIA DGX-Systemen, können mit diesen Techniken Spitzenleistungen bei GPU-beschleunigten Anwendungen erzielen. Und es ist wichtig, diese Single-Node-Multi-GPU-Techniken zu implementieren, bevor Sie Ihre Anwendungen über mehrere Nodes skalieren.

Bitte beachten Sie, dass eine einmal bestätigte Buchung nicht mehr rückerstattet werden kann. Das bedeutet, dass Sie Ihren Platz für eine Veranstaltung nach der Bestätigung nicht mehr stornieren können und keine Rückerstattung erfolgt, unabhängig von der Teilnahme an der Veranstaltung.

Dieser Text wurde automatisiert übersetzt. Um den englischen Originaltext anzuzeigen, klicken Sie bitte hier.

Voraussetzungen

  • Professionelle Erfahrung in der Programmierung von CUDA C/C++-Anwendungen, einschließlich der Verwendung des nvcc-Compilers, Kernel-Starts, Grid-Stride-Schleifen, Host-to-Device- und Device-to-Host-Speicherübertragungen und CUDA-Fehlerbehandlung
  • Vertrautheit mit der Linux-Befehlszeile
  • Erfahrung mit der Verwendung von Makefiles zum Kompilieren von C/C++-Code

Empfohlene Ressourcen, um die Voraussetzungen zu erfüllen: Fundamentals of Accelerated Computing with CUDA C/C++, Ubuntu Command Line for Beginners (Abschnitte 1 bis 5), Makefile Tutorial (durch den Abschnitt Simple Examples)

Kursziele

  • Verwendung gleichzeitiger CUDA Streams zur Überlappung von Speicherübertragungen und GPU-Berechnungen
  • Nutzung aller verfügbaren GPUs auf einem einzigen Knoten, um Arbeitslasten auf alle verfügbaren GPUs zu verteilen
  • Kombinieren Sie die Nutzung von Kopier-/Rechenüberschneidungen mit mehreren GPUs
  • Nutzen Sie die Zeitleiste des NVIDIA Nsight™ Systems Visual Profiler, um Verbesserungsmöglichkeiten und die Auswirkungen der im Workshop behandelten Techniken zu beobachten

Weiterführende Kurse

Preise & Trainingsmethoden

Online Training

Dauer
1 Tag

Preis
  • 500,– €
Classroom Training

Dauer
1 Tag

Preis
  • Deutschland: 500,– €

Derzeit gibt es keine Trainingstermine für diesen Kurs.