课程培训
IBM公司大数据培训,spark培训,hadoop培训

 

Spark培训课程


第一天: 第一讲 Spark大数据实时处理技术
 1)大数据处理技术概述
 2)Spark实时处理技术
3)Spark生态系统BDAS
4)Spark架构分析


第二讲 Spark安装配置及监控
 1)Linux开发环境准备
2)Hadoop2.X和Scala
3)搭建Spark开发环境
4)Idea及Eclipse编译和运行
5)Spark监控管理


第三讲 Scala编程语言使用概述
 1) Scala编程语言
2) 基本数据类型
3) 操作基本数据类型
4) 类和对象
5) 组合和继承


第四讲 Spark分布式计算框架
 1)Spark计算模型
2)弹性分布式数据集RDD
 3)Spark的数据存储
4)Transformation算子分类及功能
 5)Actions算子分类及功能


第五讲 Spark内部工作机制详解
1) Spark底层实现原理
2) Spark应用执行机制
 3) Spark调度与任务分配模块
 4) FIFO和FAIR调度算法
5) 相关源码分析


第六讲 Spark数据读取与存储
 1)Spark的I/O机制
2)Spark中的数据压缩
3)Spark的数据读取与存储
 4)Spark数据读写流程
 5)相关源码分析


第二天: 第七讲 Spark通信模块和容错机制
 1)Spark通信模块
2)通信框架AKKA
3)容错机制和Lineage依赖
4)检查点机制进行容错
5)Shuffle过程
6)相关源码分析


第八讲 SQL On Spark
1) BDAS数据分析软件栈
 2) SQL On Spark
 3) Spark SQL工具使用
4) Shark工具使用
5) Hive on Spark工具
6) Spark操作HBase中的数据
7)相关源码分析


第九讲 Spark流数据处理工具Streaming
1)流数据处理工具Streaming
2)Spark Streaming架构
 3)Spark Streaming原理
4)Spark Streaming实例
 5)相关源码分析
第十讲 Spark中的大数据挖掘工具MLlib
1)大数据挖掘工具MLlib
2)MLlib的数据存储
3)MLlib中的聚类和分类
4)MLlib算法应用实例
5)利用MLlib进行推荐 5)相关源码分析


第十一讲 Spark大规模图处理工具GraphX
1)大规模图处理工具GraphX
2)GraphX的运行架构
 3)GraphX操作使用
4)GraphX使用实例
5)相关源码分析


第十二讲 Spark与其他大数据技术的融合与应用
1)与Hadoop/Yarn集群应用的协作
2)与Docker等其它云工具配合
3)Spark在移动互联网业务中的应用
4)Spark综合案例分析




如果您想学习本课程,请预约报名
如果没找到合适的课程或有特殊培训需求,请订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请

服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。

专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获
报名表下载
联系我们 更多>>

咨询电话010-62883247

                4007991916

咨询邮箱:soft@info-soft.cn  

 

微信号.jpg

  微信咨询

随时听讲课

聚焦技术实践

订制培训 更多>>