课程大纲
主题 |
内容 |
数据治理范围
|
数据治理面临的挑战
数据的多元化
数据的复杂性
数据的完整性
数据生命周期管理
统一元数据管理
数据集成方法
数据安全
数据湖架构
基于大数据平台的数据建模
RMDBS数据的增量实时同步采集
|
大数据在国内的运用
|
大数据在国内的使用介绍
离线计算框架介绍
流式计算框架介绍
内存计算框架介绍
内存流式计算介绍
大数据实时请求框架介绍
大数据在证券的案例介绍
大数据在银行的案例介绍
|
大数据生态系统介绍
|
分布式存储—HDFS
分布式并行计算—MapReduce
基于Hadoop的数据仓库—Hive
统一元数据管理—Hcatlog
集群管理工具—ambari
工作流工具—Oozie
数据的并行采集—Flume
MapReduce脚本工具—Pig
与关系型数据库之间的数据迁移—Sqoop
资源管理平台—Yarn
数据生命周期管理—Falcon
数据挖掘算法—Mahout
分布式统一服务—Zookeeper
Hadoop安全工具—Knox
流式计算框架—Storm
内存计算框架—Spark
数据挖掘框架—Mahout、Mllib和Graphx
|
统一元数据管理
|
元数据概念
Hadoop平台元数据处理面临的问题
Hcatalog介绍
Hcatlog原理和架构解析
Hive与Hcatlog关系
Hcatlog解决那些问题
Hcatlog实战
元数据注册机制
基于Hadoop平台元数据处理方案
|
数据生命周期管理
|
数据质量
数据标准
数据生命周期管理的重要性
数据生命周期的概念
开源Falcon解决那些问题
Falcon架构和原理
Falcon实战
Falcon+HDFS、Hive实战
Falcon+Oozie实战
|
大数据平台安全
|
Hadoop平台安全介绍
HDFS2.0的ACLS介绍
Hive安全介绍
Hbase基于namespace的安全介绍
Hadoop访问安全控制Knox
Knox的架构和原理
Knox与Kerberos介绍
Ranger安全工具介绍
Knox+Ranger整合控制Hadoop平台的安全
基于Hadoop平台的数据加密
|
数据湖
|
数据湖概念
数据湖解决那些问题
数据湖架构
数据的整合
数据的landing zone功能
离线数据管理
流式数据管理
RDBMS全量和增量数据实时采集
Databus框架介绍
Databus功能介绍
Databus解决那些问题
|
Think big基于Hadoop平台实战
|
怎么快速迭代在Hadoop平台开发
Hadoop平台设施的方法论
2个月快速基于Hadoop平台开发步骤
Hadoop平台开发的难点
Hadoop平台开的注意点
Hadoop平台设施的流程
|
互联网大数案例分享
|
淘宝大数据平台深度解析
基于大数据平台的实时营销架构
淘宝大数据推荐架构介绍
大数据实时分析架构
|
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获