《八个案例贯通R语言数据分析与挖掘》实战培训课

转载 2015年11月20日 17:09:42

【培训目标】
本次培训采取深入浅出的方法,先以简单的案例引入R数据分析的基本原理,随后重点讲解多种常用单元的功能和特性,以及有R数据分析与数据的实用技术和处理方法,紧密结合应用实例,针对工作中存在的疑难问题进行分析讲解和专题讨论,有效提升学员解决复杂问题的能力。

【培训对象】
各省市、自治区从事金融、医疗、保险、电商、卫生、统计、银行、通信、环境、基金、等金融衍生品行业与数据分析统计相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员,以及广大R爱好者。

【时间地点】
2015年12月04日—-12月07日 中国*北京
(时间安排:第一天报到,授课三天)

【培训费用】
¥RMB:3200元/人(含报名费、授课费、教材资料费、场地费、证书费、午餐费等)
参加学员可获得由中国管理科学院人才战略研究所颁发的《数据分析工程师》人才技能证书。
参加学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据分析与挖掘应用工程师》职业水平证书

主讲专家:
陈堰平,曾担任新华社国家金融信息中心指数研究院研发部负责人,现在是雪晴数据网(http://www.xueqing.cc)创始人,微软公司兼职顾问。主要从事经济指数、金融衍生品、统计咨询、金融数据分析、开发基于R语言的定制化统计软件,曾给惠普中国研发中心、花旗银行、东方航空、中国电信做过培训和咨询,多次在中国R语言会议上发表演讲,2013 Oracle技术嘉年华演讲嘉宾。现在同时也是统计之都管理团队成员,中国R语言会议理事会成员,曾获CQF国际数量金融认证,译作有《R语言编程艺术》,目前还参加其他几本R语言图书的编写和翻译。

培训方式:
(一)课程讲座; (二)专题小组研讨与案例讲解分析结合; (三)上机操作;
(欢迎学员带着在工作中遇到的实际问题与老师一起探讨)

联系方式:
联系人: 赵龙
手 机: 185-1174-5982 E_mail: long.zhao@supstat.com.cn
课程大纲

案例一:营销决策与分析实战
描述:营销活动的决策需要数据来支撑,本案例将以营销决策为场景,讲解如何用R语言实现以下分析:
描述性分析:做商品销售情况的分组汇总、分析各地区销售额情况、市场竞争形势分析、品牌区域差异化分析、销售渠道分析等
推理性分析:广告投放资金与销售额相关性分析
预测性分析:销售额与销售费用的预测
最优化决策:企业销售利润最大化分析
可视化展示:并用shiny包创建基于Web的动态仪表盘,实现各地区销售额动态比较图

案例二:网站用户行为分析
描述:本案例主要分析的是某在线教育网站的用户登录行为数据、选修课程数据,以研究该网站运营情况和用户偏好。将会涉及以下知识点:
用R连接MySQL数据库,读取网站用户行为数据
用dplyr等R包对原始数据做处理
分析网站的运营情况,计算每日新增用户数、日活跃用户等指标
用REmap包绘制可交互的用户来源地图
用R连接Google Analytics抓取用户访问数据
用knitr编写自动化报告

案例三:从网络抓取数据编制美元指数
描述:本案例将展示R的数据抓取能力,从美联储网站抓取美元兑几种国际主要货币的汇率,并计算美元指数,最后用shiny动态展示。

案例四:社交网络文本分析与用户情感分析
描述:本案例涉及从微博抓取跟特定关键词相关的文本数据,并分析用户言论主题和感情倾向,并用可视化的方法来展示正负感情色彩所包含的关键词。
涉及的知识点:
微博数据抓取
中文分词
文本分类
主题模型
情感分析
词云展示

案例五:脑外伤急救后迟发性颅脑损伤影响因素分析案例
描述:研究者收集了脑外伤急救病例共201例,希望能够从从分析出导致急救后迟发性颅脑损伤的主要影响因素。分析中首先用标准的Logistic回归模型进行了影响因素筛选,然后利用分类树探索自变量中是否存在交互作用,最后利用广义线性模型过程拟合带交互项的Logistic回归模型进。
涉及知识点:卡方检验、Logistic回归、分类树、广义线性模型

案例六:医疗保险的欺诈发现
描述: 本案例将对一个虚拟的医疗保险欺诈的案例进行介绍,尽管这里的内容包含了特定行为逻辑,但是相信其中的一些思路和方法对其他行业也具有借鉴意义。本案例涉及的知识点有:
Benford定律
聚类分析
关联规则

案例七:电信运营商业务数据分析及客户流失分析
描述:本案例对电信业流失问题遵循CRISP-DM方法论的流程使用数据挖掘方法,以三种思路建立了数据挖掘模型然后对模型的效果进行了评估。主要包含以下内容:
数据的理解与数据准备
建立模型与模型评估
- 模型的选择
- 建模思路1:聚类
- 建模思路2:用决策树生成规则
- 建模思路3:用神经网络生成流失评分
模型的应用及营销预演

案例八:构建电影推荐系统
描述:本案例将以一个影视社交网站的数据为例,演示构建推荐系统的两大类基本方法:
基于内容的推荐:根据用户自身过去的偏好和物品的相似程度来推荐。
协同过滤算法:根据用户过去的行为,以及其他用户所做的类似决定,来建立推荐模型。包括三种方法:KNN协同过滤,基于关联规则的协同过滤,基于矩阵分解的协同过滤。

相关文章推荐

R语言主成分和因子分析篇

转载自:http://blog.csdn.net/lilanfeng1991/article/details/36190841 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化...

R语言-回归分析相关函数

摘自:R语言实用教程 薛毅、陈立萍编著

R语言案例分析:财政收入的多元相关与回归分析

R语言案例分析:财政收入的多元相关与回归分析 数据集下载 (mvcase3.xls)中的表Case3。  y:财政收入  x1:国内生产总值  x2:能源消费总量  x3:从业人...

R语言实用案例分析-相关系数的应用

在日常工作中,经常会存在多个变量之间存在关联关系,比如学习数学好的同学,物理成绩可能也比较高。在公司中外貌和讨人喜欢的关系往往也比较大,在人事招聘过程中,如果想要更加综合的评价某个人,需要把相关系数比...

R语言学习-实例一

一个综合性实例(来自炼数成金)模拟产生统计专业同学的名单(学号区分),记录数学分析,线性代数,概率统计三科成绩,然后进行一些统计分析 先简单介绍几个函数: 正态分布函数rnorm() 泊送分布函...
  • wwwlxz
  • wwwlxz
  • 2015-03-09 11:08
  • 1469

非常简单而又非常完整的R语言主成分分析实例

本篇文章不讲有关主成分分析的理论知识,只讲实际操作。实例:(中学生身体四项指标的主成分分析)在某中学随机抽取某年级30名学生,测量其身高(X1)、体重(X2)、胸围(X3)和坐高(X4),数据如下。试...

R语言实用案例分析-1

在日常生活和实际应用当中,我们经常会用到统计方面的知识,比如求最大值,求平均值等等。R语言是一门统计学语言,他可以方便的完成统计相关的计算,下面我们就来看一个相关案例。 1. 背景 最近西安交大大...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:深度学习:神经网络中的前向传播和反向传播算法推导
举报原因:
原因补充:

(最多只允许输入30个字)