Advanced Learning Path

Master advanced GPU programming patterns including Ring Kernels, synchronization primitives, multi-GPU coordination, and performance profiling.

Prerequisites

By completing this path, you will:

Duration: 90-120 minutes

Learn persistent GPU computation with actor-style message passing.

Duration: 60-90 minutes

Master barriers, memory ordering, and multi-kernel coordination.

Duration: 90-120 minutes

Scale applications across multiple GPUs with P2P transfers.

Duration: 60-90 minutes

Use GPU timing APIs for precise performance measurement and optimization.

After completing this path, continue to the Contributor Path to learn how to extend DotCompute or explore the comprehensive Ring Kernels Guide.

Estimated total duration: 6-8 hours