自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 收藏
  • 关注

原创 机器学习--KNN的使用(Pyhton篇&R篇)

机器学习–KNN的使用关于机器学习里面的KNN有很多文章介绍了,这里只是讲解KNN的python使用方法我们采用的是kaggle上面的数据来学习knn。数据传送门上面红色框内就是我们需要的数据。 test.csv是测试数据,train.csv是训练数据, trainLabels.csv是训练数据的标签或者类别,里面的类别只有两个(0或1)。目的:我们在已经给出的数据里面,...

2018-08-29 15:36:11 810

原创 数据分析--用R语言预测离职(下)

数据分析–用R语言预测离职(下)接上一篇~接下来我们探索离职和其他分类变量的关系~> library(scales)> k1 <- ggplot(attr.df, aes(x=Gender,fill=Attrition))++ geom_bar(position = "fill")++ labs(y="Percentage")+scale_y_con...

2018-06-21 16:17:03 3477

原创 数据分析--用R语言预测离职(上)

数据分析–用R语言预测离职(上)本文参考的文章: 1.R语言-离职率分析 2.R语言-逻辑回归+主成分分析-员工离职预测训练赛 3.Kaggle十大经典案例—员工离职预测 4.Kaggle十大案例精讲(免费) 5.数据分析实例:员工流失建模与预测数据来源: SAMPLE DATA: HR Employee Attrition and Performance数据可以直接下载,...

2018-06-20 22:08:24 5378 2

原创 数据分析--R的文本分词(对天龙八部来分词看结果~)

数据分析–R的文本分词有的时候我们需要对某些评论或者文章进行分析,比如关键词,词频等问题,这个时候我们用R的jiebaR这个包分析,是非常方便的~这里Mark一下:官方文档、jiebaR官网、jiebaR的Github和中文文档第一步:安装jiebaR包,然后导入> install.packages("jiebaR")> library(jiebaR)第二...

2018-06-08 16:21:58 1372

原创 《数据分析实战》--用R做聚类分析

《数据分析实战》–用R做聚类分析本文参考的是《数据分析实战》的第八章。背景:针对某公司的产品,现目前需要服务好已有的用户,针对不同的用户群体设计并推广不同的营销策略。现状:目标用户不明确。预期:明确目标用户群。读取数据读取Dau数据:> dau <- read.csv('dau.csv',header = T,stringsAsFactors = F)...

2018-06-04 17:12:39 6555 4

原创 《数据分析实战》--用R做逻辑回归分析

《数据分析实战》–用R做逻辑回归分析本文参考的是《数据分析实战》的第七章。背景:针对某公司的一个产品,发现其用户量不断的减少。 当时该产品发布的时候智能手机还并未普及,随后智能手机的市场不断的扩大,该产品也增加了账户迁移功能,即在智能手机上继续使用过去非智能手机中的游戏账号。该功能上线后,智能手机的用户稳步上升,然而最近总用户量却不断的减少,发现是产品的非智能手机用户大量减少。 现...

2018-06-02 13:42:04 2262

原创 《数据分析实战》--用R做多元回归分析

《数据分析实战》——用R做多元回归分析本文参考的是《数据分析实战》的第六章。背景:针对某公司对产品的不同广告平台投放,基于过去的新增用户数据和投放数据,希望获得更好的广告投放方式,以此建立数据模型。现状:不同的广告平台投放,广告效果不同。预期:对不同的广告平台加以比例,达到最佳效果。明确问题:通过过去的投放数据和新增用户数据,用多元回归方程来确定不同平台的投放广告比例。在商...

2018-06-01 11:10:30 13084 2

原创 《数据分析实战》--用R做A/B测试

《数据分析实战》—用R做A/B测试本文参考的是《数据分析实战》的第五章。背景:在某公司中,对与某些产品做促销活动,但是其中有个产品相对于其他产品来说购买率低下,希望通过数据分析找出购买率偏低的原因。现状:和其他产品相比购买率偏低。预期:希望能够提升到其他应用相同的购买率明确问题:经过一系列的沟通,很有可能是由于该应用展示的问题而导致的(不同应用对应不同UI)不同产品的购买率...

2018-05-31 16:58:53 5722

原创 《数据分析实战》--用R做交叉列表

《数据分析实战》–用R做交叉列表本文参考的是《数据分析实战》第四章。背景:针对某公司的产品,发现当月的用户使用量减少了很多,但是和上月相比,本月的商业宣传和月度活动并无大的变化,需查明用户数量减少的原因。现状:同上月相比用户数减少...

2018-05-30 11:50:05 12102 2

原创 《数据分析实战》--用R做柱状图

欢迎使用Markdown编辑器写博客本Markdown编辑器使用StackEdit修改而来,用它写博客,将会带来全新的体验哦:Markdown和扩展Markdown简洁的语法代码块高亮图片链接和图片上传LaTex数学公式UML序列图和流程图离线写博客导入导出Markdown文件丰富的快捷键快捷键加粗 Ctrl + B 斜体 Ctrl + I ...

2018-05-29 17:51:24 10719

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除