《八个案例贯通R语言数据分析与挖掘》实战培训课

最新推荐文章于 2021-07-13 15:12:23 发布

zhao44long

最新推荐文章于 2021-07-13 15:12:23 发布

阅读量3.6k

点赞数 1

分类专栏： R语言文章标签： r语言数据分析

R语言专栏收录该内容

16 篇文章 0 订阅

订阅专栏

【培训目标】
本次培训采取深入浅出的方法，先以简单的案例引入R数据分析的基本原理，随后重点讲解多种常用单元的功能和特性，以及有R数据分析与数据的实用技术和处理方法，紧密结合应用实例，针对工作中存在的疑难问题进行分析讲解和专题讨论，有效提升学员解决复杂问题的能力。

【培训对象】
各省市、自治区从事金融、医疗、保险、电商、卫生、统计、银行、通信、环境、基金、等金融衍生品行业与数据分析统计相关的企事业单位技术骨干、科研院所研究人员和大专院校相关专业教学人员及在校研究生、硕士、博士等相关人员，以及广大R爱好者。

【时间地点】
2015年12月04日—-12月07日中国*北京
（时间安排：第一天报到,授课三天）

【培训费用】
¥RMB:3200元/人（含报名费、授课费、教材资料费、场地费、证书费、午餐费等）
参加学员可获得由中国管理科学院人才战略研究所颁发的《数据分析工程师》人才技能证书。
参加学员可获得由工业和信息化部通信和信息技术创新人才培养工程颁发《数据分析与挖掘应用工程师》职业水平证书

主讲专家:
陈堰平，曾担任新华社国家金融信息中心指数研究院研发部负责人，现在是雪晴数据网（http://www.xueqing.cc）创始人，微软公司兼职顾问。主要从事经济指数、金融衍生品、统计咨询、金融数据分析、开发基于R语言的定制化统计软件，曾给惠普中国研发中心、花旗银行、东方航空、中国电信做过培训和咨询，多次在中国R语言会议上发表演讲，2013 Oracle技术嘉年华演讲嘉宾。现在同时也是统计之都管理团队成员，中国R语言会议理事会成员，曾获CQF国际数量金融认证，译作有《R语言编程艺术》，目前还参加其他几本R语言图书的编写和翻译。

培训方式:
(一)课程讲座；（二）专题小组研讨与案例讲解分析结合； (三)上机操作；
（欢迎学员带着在工作中遇到的实际问题与老师一起探讨）

联系方式:
联系人：赵龙
手机： 185-1174-5982 E_mail： long.zhao@supstat.com.cn
课程大纲

案例一：营销决策与分析实战
描述：营销活动的决策需要数据来支撑，本案例将以营销决策为场景，讲解如何用R语言实现以下分析：
描述性分析：做商品销售情况的分组汇总、分析各地区销售额情况、市场竞争形势分析、品牌区域差异化分析、销售渠道分析等
推理性分析：广告投放资金与销售额相关性分析
预测性分析：销售额与销售费用的预测
最优化决策：企业销售利润最大化分析
可视化展示：并用shiny包创建基于Web的动态仪表盘，实现各地区销售额动态比较图

案例二：网站用户行为分析
描述：本案例主要分析的是某在线教育网站的用户登录行为数据、选修课程数据，以研究该网站运营情况和用户偏好。将会涉及以下知识点：
用R连接MySQL数据库，读取网站用户行为数据
用dplyr等R包对原始数据做处理
分析网站的运营情况，计算每日新增用户数、日活跃用户等指标
用REmap包绘制可交互的用户来源地图
用R连接Google Analytics抓取用户访问数据
用knitr编写自动化报告

案例三：从网络抓取数据编制美元指数
描述：本案例将展示R的数据抓取能力，从美联储网站抓取美元兑几种国际主要货币的汇率，并计算美元指数，最后用shiny动态展示。

案例四：社交网络文本分析与用户情感分析
描述：本案例涉及从微博抓取跟特定关键词相关的文本数据，并分析用户言论主题和感情倾向，并用可视化的方法来展示正负感情色彩所包含的关键词。
涉及的知识点：
微博数据抓取
中文分词
文本分类
主题模型
情感分析
词云展示

案例五：脑外伤急救后迟发性颅脑损伤影响因素分析案例
描述：研究者收集了脑外伤急救病例共201例，希望能够从从分析出导致急救后迟发性颅脑损伤的主要影响因素。分析中首先用标准的Logistic回归模型进行了影响因素筛选，然后利用分类树探索自变量中是否存在交互作用，最后利用广义线性模型过程拟合带交互项的Logistic回归模型进。
涉及知识点：卡方检验、Logistic回归、分类树、广义线性模型

案例六：医疗保险的欺诈发现
描述：本案例将对一个虚拟的医疗保险欺诈的案例进行介绍，尽管这里的内容包含了特定行为逻辑，但是相信其中的一些思路和方法对其他行业也具有借鉴意义。本案例涉及的知识点有：
Benford定律
聚类分析
关联规则

案例七：电信运营商业务数据分析及客户流失分析
描述：本案例对电信业流失问题遵循CRISP-DM方法论的流程使用数据挖掘方法，以三种思路建立了数据挖掘模型然后对模型的效果进行了评估。主要包含以下内容：
数据的理解与数据准备
建立模型与模型评估
- 模型的选择
- 建模思路1：聚类
- 建模思路2：用决策树生成规则
- 建模思路3：用神经网络生成流失评分
模型的应用及营销预演

案例八：构建电影推荐系统
描述：本案例将以一个影视社交网站的数据为例，演示构建推荐系统的两大类基本方法：
基于内容的推荐：根据用户自身过去的偏好和物品的相似程度来推荐。
协同过滤算法：根据用户过去的行为，以及其他用户所做的类似决定，来建立推荐模型。包括三种方法：KNN协同过滤，基于关联规则的协同过滤，基于矩阵分解的协同过滤。

zhao44long

关注

1
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
《八个案例贯通R语言数据分析与挖掘》实战培训课

【培训目标】本次培训采取深入浅出的方法，先以简单的案例引入R数据分析的基本原理，随后重点讲解多种常用单元的功能和特性，以及有R数据分析与数据的实用技术和处理方法，紧密结合应用实例，针对工作中存在的疑难问题进行分析讲解和专题讨论，有效提升学员解决复杂问题的能力。【培训对象】各省市、自治区从事金融、医疗、保险、电商、卫生、统计、银行、通信、环境、基金、等金融衍生品行业与数据分析统计相关的企事业
复制链接

扫一扫