自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

R语言中文社区

涵盖R官方、Rstudio、中国R语言会议等前沿分享。立即关注,掌握R语言全球最新资讯与成果!

  • 博客(29)

原创 R语言中文社区10篇最火的文章 | 2017大盘点

岁末年终,到了该谈终结的时候。对此,小编特别精选出10篇,这一年来R社区最火的文章(阅读量最高),分享给一直默默关注社区的你们。第十名:如何七周成为数据分析师“写这个系列,是希望在当初知乎某一个回答的基础上,单独完善出针对互联网产品和运营们的教程。不论对数据分析或数据运营,我都希望它是一篇足够好的教材。得承认我有标题党之嫌,更准确说,这是一份七周的互联网数据分析能力养成提纲。”第九名:怎样才算精通

2017-12-30 00:00:00 2447 1

转载 RCurl中这么多get函数,是不是一直傻傻分不清!!!

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。你想知道R语言中的RCurl包中一共有几个get开头的函数嘛,今天我特意数了一下,大约有十四五个那么多(保守估计)!所以如果对这个包了解不太深入的话,遇到复杂的数据爬取需求,自然是摸不着头

2017-12-29 00:00:00 1772

转载 程序员开发的“逆天”软件

我有一个师兄一个很神奇的师兄之所以说他神奇是因为他真的很神奇师兄是个典型的学霸本科跟我一样是学土木工程的,后来考研又跨专业考到了计算机,毕业后成为一名程序员。他说你知道我为什么做程序员么?因为我可以随心所欲的开发我自己想出来的东西。这让我有一种征服世界的感觉。年轻,敢想敢做,没什么不可以~1师兄刚上班的时候经常因为睡懒觉而迟到,所以经常被领导骂,他想了很多办法都没有解决,后来他自己开发了一个闹钟系

2017-12-28 00:00:00 2595 8

转载 R数据处理包plyr:超越apply函数族的向量化运算

作者:鲁伟,热爱数据,坚信数据技术和代码改变世界。R语言和Python的忠实拥趸,为成为一名未来的数据科学家而奋斗终生。个人公众号:数据科学家养成记 (微信ID:louwill12)      R有着强大而又丰富的数据处理能力,除了一些常用的基础数据处理函数之外,R还为我们提供了大量以实现不同的数据处理功能的扩展包。关注小编公众号的朋友应该还记得之前曾写过一篇关于R向量化运算的apply函数族的文

2017-12-28 00:00:00 452

转载 图解欧洲足球五大联赛 | R爬虫&可视化第五季

作者:徐麟,数据分析师,就职于上海唯品会。热爱数据挖掘和分析,喜欢用R、Python玩点不一样的数据。个人公众号:数据森麟(微信ID:shujusenlin) 往期回顾:同花顺股票分数可视化 | R爬虫&可视化第3季近三十年6000部国产电视剧告诉了我们些什么 | R爬虫&可视化第四季前言R爬虫&可视化系列文章来到了第五季,我们来聊聊欧洲足球五大联赛。本人作为一个不会踢球的资深球迷,俗称“懂球帝”

2017-12-27 00:00:00 1800

转载 R语言数据抓取实战——RCurl+XML组合与XPath解析

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。经常有小伙伴儿跟我咨询,在使用R语言做网络数据抓取时,遇到空值和缺失值或者不存在的值,应该怎么办。因为我们大多数场合从网络抓取的数据都是关系型的,需要字段和记录一一对应,但是html文档的

2017-12-27 00:00:00 1965

原创 kaggle案例:数据科学社区调查报告(附学习视频)

作者:邬书豪,车联网数据挖掘工程师 ,R语言中文社区专栏作者。微信ID:wsh137552775知乎专栏:https://www.zhihu.com/people/wu-shu-hao-67/activities本文配套学习视频及代码,点击阅读原文免费获取。2017年8月26日,全球最大的数据科学社群Kaggle发布了数据科学/机器学习业界现状全行业调查的数据集。调查问卷数据从2017年8月7日~

2017-12-26 00:00:00 1204

转载 关于程序猿的六个问答题

Q1:程序员是不是都抽烟?我想了半天我抽烟完全是因为医生,在我刚上大学的时候还不会吸烟,有一天嗓子特别疼,我就去医院检查,大夫检查之后对我说,没什么太大毛病,你少抽点烟就行了,于是乎我走出了医院,到超市买了人生中的第一盒烟……Q2:你觉得自己优秀么?这不是废话么?作为程序员的我比郭敬明高,比博尔白,比小沈阳MAN,比郭德纲帅,比刘欢脖子长,比巩汉林结实,比刘翔痘少,比曾哥唱歌有调,比周杰伦吐字清楚

2017-12-26 00:00:00 1454 3

原创 精选 | 2017年11月R新包推荐

一. 文档概述    11月份,在R官方(CRAN)共计发布了237个新包,本文选摘了40个R包,包含以下几个类别:计算方法、数据、数据科学、科学、社会科学、工具及可视化等,其余包大家可登录CRAN自行查看,希望有助于大家的学习,感谢大家对R语言中文社区的支持!二. 详细介绍1. 计算方法1)CVXR v0.94-4:  实现了一种面向对象建模语言,用于规范的凸规划(DCP),允许用户制定和解决凸

2017-12-24 00:00:00 1219

转载 商务图表案例——仿经济学人分组漏斗图~

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。今天看到一个看着挺养眼的经济学人图表案例,于是职业病爆发了,用ggplot2按照自己的思路写了一遍。现在把代码思路分享给大家!加载包:library("ggplot2")library("

2017-12-23 00:00:00 1687

转载 空巢青年,“空巢”是选择还是无奈? | 数据告诉你

城市的繁华象征着机遇和希望,总是让人心向往之。越来越多的人选择去大城市打拼奋斗,寻找未来。而远离家乡,身处都市的高楼广厦,面对夜晚的万家灯火,人总是容易心生孤独,大概所谓城市,就是几百万人一起孤独的地方。“空巢青年”这个新的群体命名最近广为流传,是指那些独自在城市打拼的年轻人,单身、上班族、独在异乡……这些是他们的人群标签;一个人吃饭旅行,到处走走停停,一个人等天亮,一个人等天黑……“一个人”是他

2017-12-23 00:00:00 472

转载 左手用R右手Python系列之——表格数据抓取之道

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。在抓取数据时,很大一部分需求是抓取网页上的关系型表格。对于表格而言,R语言和Python中都封装了表格抓取的快捷函数,R语言中XML包中的readHTMLTables函数封装了提取HTML

2017-12-22 00:00:00 2106

原创 广告投入是怎样提高新用户数的(岭回归及主成分回归) | R语言商业分析实践3

作者:杨奉山  R语言中文社区专栏作者,R语言小学生,和我一起为成为优秀的商业数据分析师努力吧 知乎专栏:https://zhuanlan.zhihu.com/YFSbda最后一次重申:一个好的商业分析项目从来都不是从数据出发的,而是根据现象提出问题,之后根据问题从大局出发进行总体的(非数据上)分析(要清晰的把握自己的问题是什么,如何通过数据分析解决问题),根据这一步的分析建立具体数据分析框架,凭

2017-12-22 00:00:00 871 1

转载 学历真的改变能命运? | 数据告诉你

央视新闻曾做过关于高考的调查,结果有七成网友支持高考取消数学,看到新闻后,有一位网友却一针见血地评论道:数学考试存在的意义就是把这七成网友筛选掉。的确,虽然买菜不需要专业数学知识,但数学可以决定我们在哪里买菜。很多人想要快乐地生活下去,靠的是创造与重复假象不断地麻痹自己,这也正是绝大多数人传播读书无用论的根本动机。知识决定命运,读书无用论不过是学霸的谦辞和学渣的借口罢了。Table 1: Mean

2017-12-22 00:00:00 512

转载 给程序员的10条建议,吐血推荐!

1. 想清楚,再动手写代码刚入行的新手,为了展示自己的能力,拿到需求迫不及待地就开始上手写代码,大忌!2. 不交流,就会头破血流不爱说话和沟通,需求都理解错误了,最后做出来才发现,只能加班返工。3. 文档没人看,但还是要写文档的作用大部分时候不是用来沟通的,是用来做记录的,大部分需求还是通过口头沟通,但是不写文档做记录,后续就容易扯皮。4. 一定要写注释时间久了,你会连自己的代码都看不懂。5. 别

2017-12-21 00:00:00 1082

转载 R语言爬虫实战:知乎live课程数据爬取实战

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。本文是一篇R语言爬虫实战练习篇,同样使用httr包来完成,结合cookies登录、表单提交、json数据包来完成整个数据爬取过程,无需书写复杂的xpath、css路径甚至繁琐的正则表达式(

2017-12-21 00:00:00 3500

原创 数据分析/数据挖掘 入门级选手建议

作者:Charlotte77  数学系的数据挖掘民工  博客专栏:http://www.cnblogs.com/charlotte77/ 个人公众号:Charlotte数据挖掘(ID:CharlotteDataMining)  精彩回顾:数据分析/数据挖掘/机器学习---- 必读书目1.数据分析和数据挖掘联系和区别联系:都是搞数据的区别:数据分析偏统计,可视化,出报表和报告,需要较强的表达能力。数

2017-12-20 00:00:00 582

转载 数据分析/数据挖掘/机器学习---- 必读书目

作者:Charlotte77  数学系的数据挖掘民工  博客专栏:http://www.cnblogs.com/charlotte77/ 个人公众号:Charlotte数据挖掘(ID:CharlotteDataMining)  总结一下我读过的机器学习/数据挖掘/数据分析方面的书,有的适合入门,有的适合进阶,没有按照层次排列,先总结一下,等总结的差不多了再根据入门--->进阶分块写。下面列的书基本

2017-12-19 00:00:00 482

转载 9张图带你了解全宇宙最神秘的团体——程序员

性取向想加薪怎么办?去一家公司主要看什么?最孤独的时刻两个程序员见面聊什么人生理想最讨厌听到的话如何让一个程序员辞职最心烦的事儿公众号后台回复关键字即可学习

2017-12-06 00:00:00 625

转载 冬日暖阳!网易大数据应用与分析实践分享沙龙【北京站 12.16】

活动背景网易被称为是互联网里的一股清流,继上海后网易的小伙伴转战北京, 12月16日,网易一群极具个性的数据分析专家、产品技术大拿将抵达北京,与北京数据圈的朋友一起分享网易大数据的应用与分析实践之路,12月16日下午我们一起相约3W咖啡!如何在业务中规划落地场景,如何在实践中规划科学架构;针对数据业务人员的一次沙龙活动,邀请客户分享使用有数的经验及带来的价值,网易数据分

2017-12-06 00:00:00 442

转载 论剑大数据技术,效率为王!天善智能掘金数据技术沙龙【上海站 12.09】

活动主题探索数据之美活动亮点聚集数据领域朋友,交流数据领域(商业智能、大数据)发展动态;分享领先技术、数据领域行业发展、数据产品、数据应用、解决方案、在行业中的实践心得;掘金数据价值,探索数据之美。活动时间  2017年12月09日(周六)  13:00 - 17:45活动地点上海市 杨浦区政学路77号Innospac

2017-12-06 00:00:00 382

转载 数据预处理中的缺失值问题

作者:晔无殊  R语言中文社区专栏作者博客地址: https://github.com/elise-is/Statistical_Blog/blob/master/Missing_Value/MVI.md1. 简介1.1 缺失值的分类缺失值从数据分布上可被分为三类 (Gelman and Hill 2006, Little and Rubin (20

2017-12-05 00:00:00 3123

转载 程序员写代码时的各种内心戏 ……

01读大神写的代码的时候:这是什么…………我X,太牛X了。读刚来的程序员写的代码的时候:这是什么…………我X,太傻X了。02读大神写的代码的时候当读其他程序员写的代码的时候03当别人写的bug,让自己

2017-12-05 00:00:00 1959 2

转载 我的商业数据分析成长之路(书籍方面) | 引言

作者:杨奉山  R语言中文社区专栏作者,R语言小学生,和我一起为成为优秀的商业数据分析师努力吧 知乎专栏:https://zhuanlan.zhihu.com/YFSbda写文章是一个很好理清思路的方式,同时也有助于提高逻辑表达能力。思来想去,决定开个专栏,将学习心得与实践都整理起来,也方便自己回顾。请各位多多指教。下面介绍我学习的书籍,其中一部分已经学透、一部

2017-12-04 00:00:00 4040

转载 左手用R右手Python系列16——XPath与网页解析库

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。最近写了不少关于网页数据抓取的内容,大多涉及的是网页请求方面的,无论是传统的RCurl还是新锐大杀器httr,这两个包是R语言中最为主流的网页请求库。但是整个数据抓取的流程

2017-12-04 00:00:00 1211

转载 2017中国“互联网+”数字经济指数 | 腾讯研究院

2017中国“互联网+”数字经济峰会举办,腾讯研究院在峰会上发布了《中国“互联网+”数字经济指数(2017)》报告。报告由腾讯公司联合滴滴出行、美团点评、京东、携程等企业,共享大数据汇聚而成。涵盖国内31个省、自治区,直辖市并以5个梯次呈现出351个城市的数字经济发展规模以及程度。数据显示, 2016 年我国数字经济总体量占到了 GDP 总量的 30.61%,数字经济成为我国经济重要组成部分。无论

2017-12-04 00:00:00 1691

转载 终于等到你——ggplot2树状图

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。2017年8月份的R语言更新包中,默默地加入了支持ggplot2树状图的新几何对象,从此在R语言中制作树状图,不用再求助于第三方包的辅助了。该包既有Cran上的

2017-12-02 00:00:00 2522

原创 左手用R右手Python系列——模拟登陆教务系统

杜雨,EasyCharts团队成员,R语言中文社区专栏作者,兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。最近在练习R语言与Python的网络数据抓取内容,遇到了烦人的验证码问题,走了很多弯路,最终总算解决了。在分享这篇文章之前,只想感慨一声,虽然Python拥有更为完善的爬虫

2017-12-01 00:00:00 731

原创 R语言实战:预测钻石的价格

作者:刘小芬,R语言中文社区专栏作者。知乎专栏:https://www.zhihu.com/people/liu-xiao-fen-10/columns数据来源:R中的ggplot2包的自带数据diamond数据分析目的:建模,预测钻石的价格。数据分析思路:1.单变量跟价格的关系:分别探讨克拉、颜色、纯度、深度、体积、切割跟价格的关系。2.多变量跟价格的关系:分别探讨多

2017-12-01 00:00:00 3020

空空如也

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除