大数据分析及可视化培训课程
培训对象:
1. 大数据分析及可视化应用开发工程师
2.大数据分析项目的规划咨询管理人员
3.大数据分析项目的IT项目高管人员
4.大数据分析项目的售前和售后技术支持服务人员
培训大纲:
知识模块
|
授课内容
|
数据处理及复杂数据可视化(一)
|
第一讲 大数据挖掘及可视化介绍
Ø 数据挖掘及可视化背景
Ø 数据挖掘流程
Ø 常用挖掘工具介绍
Ø R语言的优势
Ø R数据挖掘可视化工具-Rattle快速上手
Ø R语言对复杂数据可视化的优势
Ø R语言快速入门
Ø 利用caret包做数据抽样及虚拟化处理
|
数据处理及复杂数据可视化(二)
|
第二讲 数据质量分析及高级可视化
Ø 缺失值处理的高级方法
Ø 异常值甄别的高级方法
Ø 数据可视化进阶:lattice及ggplot2包介绍
Ø 数据交互可视化:rCharts、recharts、networkD3、plotly等包介绍
|
数据挖掘模型实战(一)
|
第三讲 聚类分析及R语言实现
聚类分析是一种原理简单、应用广泛的数据挖掘技术。顾名思义,聚类分析即是把若干事物按照某种标准归为几个类别,其中较为相近的聚为一类,不那么相近的聚于不同类。
Ø 案例一:对著名的鸢尾花数据进行K均值聚类分析
Ø 案例二:对汽车数据进行K均值聚类分析
Ø 案例三:对洛杉矶街区数据进行层次聚类
Ø 案例四:对汽车数据进行层次聚类
第四讲 关联规则及R语言实现
关联规则(著名的“啤酒和尿布”)是数据挖掘的基础和核心技术之一,本讲将着重围绕经典的Apriori算法,阐明关联规则的支持、置信和提升程度与控制,使用R语言快速完成关联规则分析,并通过arulesViz扩展包对关联规则进行可视化展示。
案例:利用超市购物篮Groceries数据进行关联规则分析
|
数据挖掘模型实战(二)
|
第五讲 KNN近邻算法及R语言实现
KNN(k-Nearest Neighbor)分类算法是数据挖掘分类技术中较简单的方法之一。所谓k最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。
Ø 案例一:对鸢尾花数据集进行knn分类
Ø 案例二:对乳腺癌数据进行knn分类
Ø 案例三:对文本数据进行knn分类
第六讲 决策树分类及R语言实现
决策树是数据挖掘的经典方法,其原理容易被理解。本讲主要讲授两种最为普遍的决策树算法:CART和C5.0算法,使用rpart和C50函数进行R语言分析。
Ø 案例一:对鸢尾花数据集运用C50算法分类
Ø 案例二:对鸢尾花数据集运用CART算法进行分类
Ø 案例三:对汽车数据运用CART对汽车重量进行预测
|
行业应用案例分享(一)
|
第七讲 深度挖掘用户付费行为及社会网络分析
Ø 对用户的购买行为进行购物篮分析
Ø 智能推荐系统常用算法介绍
Ø 对用户购物行为构建智能推荐系统
Ø 社会网络图基本知识
Ø 利用R语言绘制社会网络图
Ø 利用Gephi绘制社会网络图
Ø 对用户购物行为进行聚类分析,发现社群
|
行业应用案例分享(二)
|
第八讲 客户价值分析
Ø 背景与挖掘目标
Ø 分析方法及过程
Ø 数据探索分析
Ø 数据预处理
Ø 模型构建
Ø 模型应用
|
|
第九讲 漏斗模型及路径分析
Ø 漏斗模型的主要应用场景
Ø 路径分析的主要应用场景
Ø 漏斗模型与路径分析的不同点
Ø sunburst事件路径图的绘制方法
Ø 利用基于时序的关联规则对点击事件进行分析
|
如果您想学习本课程,请
预约报名
如果没找到合适的课程或有特殊培训需求,请
订制培训
除培训外,同时提供相关技术咨询与技术支持服务,有需求请发需求表到邮箱soft@info-soft.cn,或致电4007991916
技术服务需求表点击在线申请
服务特点:
海量专家资源,精准匹配相关行业,相关项目专家,针对实际需求,顾问式咨询,互动式授课,案例教学,小班授课,实际项目演示,快捷高效,省时省力省钱。
专家力量:
中国科学院软件研究所,计算研究所高级研究人员
oracle,微软,vmware,MSC,Ansys,candence,Altium,达索等大型公司高级工程师,项目经理,技术支持专家
中科信软培训中心,资深专家或讲师
大多名牌大学,硕士以上学历,相关技术专业,理论素养丰富
多年实际项目经历,大型项目实战案例,热情,乐于技术分享
针对客户实际需求,案例教学,互动式沟通,学有所获