CUDA培训课程
课程目标:
通过该课程的学习,学员应能够掌握CUDA的原理、CUDA优化手段,以及各种核心的GPU并行编程方法。掌握GPU的显存组织方式以及如何调试GPU程序以及不同架构下的并行编程思想。
课程大纲
主题
|
内容
|
CUDA入门
|
1. CUDA 简介
2. CUDA kernel函数,warp,线程组织
3. 系统架构
4. 内存映射
5. CUDA三步式编程结构
|
在CUDA-GDB中理解CUDA
|
1. CUDA-GDB 基本用法
2. 观察GPU寄存器
3. 观察错误信息
4. 从GPU上打印信息
5. 试验:编译和调试向量乘法程序
|
使用NSight调试CUDA程序
|
1. NSight简介,安装和设置环境信息
2. 在CUDA info窗口观察计算状态
3. 试验:编译和调试矩阵向量乘法程序
4. 试验:使用Nsight调试CUDA程序
|
使用CUDA profiler 优化CUDA程序
|
1. 测量GPU时间,nvprof,命令行选项
2. 分析热点,采样视图
3. 内存优化,共享内存
4. 试验:使用nvprof优化CUDA程序
|
GPU深度学习的应用
|
深度学习GPU解决方案:
基于GPU的交互式深度学习训练平台:DIGITS;
深度学习框架的GPU加速:TensorFlow,Caffe等;
NVIDIA深度学习SDK:cuDNN,TensorRT,NCCL;
深度学习显卡选择;
|
OpenACC并行编程
|
OpenACC上机实战:Helloworld
OpenACC四步开发流程:判断并行性,并行化表达,显式数据传递,优化
判断并行性:Profile工具pgprof
并行化表达:引导关键字Kernerls和Parallel Loop
显式管理数据的拷贝:引导关键字Data
|
OpenCL并行编程
|
OpenCL:编程模型,存储模型
生态(覆盖intel,amd,nvidia,移动端arm)
CUDA vs OpenCL
OpenCL向哪里走
|
AMD ROCM HC/HIP编程
|
AMD并行编程
AMD生态
hipify转换
HC/HIP编程
HIP vs OpenCL
|
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获