自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

R语言中文社区

涵盖R官方、Rstudio、中国R语言会议等前沿分享。立即关注,掌握R语言全球最新资讯与成果!

  • 博客(49)
  • 收藏
  • 关注

原创 谈谈R中的乱码(二)

作者简介Introduction数据匠(baidao.net):http://www.baidao.net/往期回顾谈谈R中的乱码(一)保真的读写方式这是什么意思呢?先看两个代码示例:示例一来自 sjPlot 的示例,青椒群主丁哥也提到了(青椒https://mp.weixin.qq.com/s/dHt5sUeu6_3gQyDZ9JHkEw),不过遇到障碍就略过,不符合我们 rebuild the

2018-01-31 00:00:00 4658

转载 大数据下的中国女人,看完惊呆了

愿关注我们的人都能找到属于自己的皮球本文来源:大数据人精选自国馆前段时间,美国国家统计局发布了一组关于世界各国劳动参与率的数据,中国赫然位列世界第一,劳动总量世界第一,劳动参与率世界第一。所谓劳动总量,就是所有工作的人的工作时间的总和,所谓劳动参与率,就是参加工作的人占全体人口的百分比。世界各国劳动参与率,圆的面积代表劳动总量,中国排名第一;横轴代表劳动参与率,中国达到76%,一样是世界第一。中国

2018-01-31 00:00:00 924

转载 城市魅力排行榜丨这座城市竟然超越北上广!

愿关注我们的人都能找到属于自己的皮球文章来源:新一线城市研究室                 新华社瞭望智库中国城市的进化并不是只有一条确定的道路,沿着自己最擅长的轨迹,才会成为人们心中那个特别的城市。依据最新一年的160个品牌商业数据、17家互联网公司的用户行为数据和数据机构的城市大数据,第一财经·新一线城市研究所对中国338个地级以上城市再次排名。以此综合计算得到的结果是,北上广深4个一线城

2018-01-30 00:00:00 1009

原创 R可视化分析美国的肥胖症,嘿!

作者简介Introduction邬书豪,车联网数据挖掘工程师 ,R语言中文社区专栏作者。微信ID:wsh137552775知乎专栏:https://www.zhihu.com/people/wu-shu-hao-67/activities往期回顾kaggle案例:数据科学社区调查报告(附学习视频)kaggle案例:员工离职预测(附学习视频)Kaggle案例~R可视化分析美国枪击案(附数据集和代码)

2018-01-30 00:00:00 1268

原创 R语言可视化学习笔记之ggrepel包

作者简介Introductiontaoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/往期回顾R语言学习笔记之聚类分析R语言可视化学习笔记之ggpubr包R语言可视化学习笔记之添加p-value和显著性标记R语言可视化学习笔记之相关矩阵可视化包ggcorrplotlibrary(ggplot2)#使用数据集mtcars演示ggplot(mtca

2018-01-29 00:00:00 5882

转载 雷军自述:我十年的程序员生涯

愿关注我们的人都能找到属于自己的皮球文章来源:编程牛人最近,和UCWEB同事讨论,怎么才能把我们的UCWEB做到极致。我说,“手机上的平台非常多,如果想做好,需要足够多、足够优秀的程序员。优秀的程序员如何定义呢?首先必须热爱写程序,其次必须是一个完美主义者。只有这样的人,才能把事情做得极致。”说着说着,我怀念起我过去写程序的日子,从1987年到1996年,那是一段阳光灿烂的日子。几年前我无意中从网

2018-01-29 00:00:00 450

转载 如何成为一名卓越的数据科学家——第一剑之再谈问题定义

作者简介Introduction杨滔,桃树科技(TaoData)创始人,专注于下一代人工智能产品的研发、应用与商业化。拥有超过十年机器学习研究与应用经验。奥克兰大学机器学习博士,悉尼科技大学博士后。曾任阿里巴巴集团数据科学家,建立淘宝网数据科学团队,首创聚划算爆款模型。曾任F团首席科学家,建立F团数据化运营体系。往期回顾如何成为一名卓越的数据科学家——开篇七剑如何成为一名卓越的数据科学家 ——七剑

2018-01-29 00:00:00 453

转载 【R图秀-2】社交网络数据可视化(一)

作者简介Introduction傅兴:个人公众号:Rapp往期回顾【R图秀-1】12306列车数据可视化为了进一步提高自己数据获取的能力,我把目光放到了互联网上一个重要的数据来源:社交网络(Social Network),比如国外的facebook和twitter,以及国内的微博和微信。由于访问facebook和twitter比较困难,我最终选择新浪微博作为分析的对象。我首先学习的是新浪微博的AP

2018-01-28 00:00:00 5083

原创 精选| 2017年12月R新包推荐

经济学家们所说的无形之手,似乎在引导市场开发新的R包。12月份收录在CRAN的129个新包里面,有8个关于计算方法(下文均有介绍)。本文选摘了40个R包进行简单介绍,其余包大家可登录CRAN自行查看,希望有助于大家的学习,感谢大家对R语言中文社区的支持!一. 计算方法1. alphashape3d :  提供计算三维空间中有限点集的α形计算(凸包的泛化)的功能;2. deGradInfer :

2018-01-27 00:00:00 1353

转载 【R图秀-1】12306列车数据可视化

作者简介Introduction傅兴:个人公众号:Rapp往期回顾用R语言来试着分析一下12306官网上的列车数据。我的目的不是做一个同样的命令行火车票查看器,而是通过实战来练习如何抓取、整理、分析数据,并对分析结果进行可视化。在抓取数据前,首先要确定列车的出发地和目的地是哪里。我选择上海作为出发地,12306官网上的其他32个热门城市作为目的地。发车时间选择十一国庆节(2016-10-01)下面

2018-01-26 00:00:00 2161

原创 R语言可视化学习笔记之相关矩阵可视化包ggcorrplot

作者简介Introductiontaoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/往期回顾R语言学习笔记之聚类分析R语言可视化学习笔记之ggpubr包R语言可视化学习笔记之添加p-value和显著性标记基于ggplot2包以及corrplot包的相关矩阵可视化包ggcorrplot,ggcorrplot包提供对相关矩阵重排序以及在相关图中展

2018-01-25 00:00:00 8252 1

转载 谈谈R中的乱码(一)

作者简介Introductionbaidao:个人博客: 数据匠:http://www.baidao.net/在R教学中,首先要跨过去的一座大山就是乱码问题。很多学生在装好R和RStudio之后,刚刚运行RStudio,还未尝个鲜,写出R的第一段甚至人生第一段hello world代码,乱码就来立个下马威了(此处应该有乱码翻车现场截图)。对于许多从 Stata 转过来的社科领域研究人员来说,在学习

2018-01-24 00:00:00 29114 3

转载 从咨询公司学到的思考分析方法

作者:秦路个人公众号:秦路我们一直说的思考能力,它是可以经培养和训练,后天习得的特质。这也意味着我们可以借助前辈们的经验,站在巨人的肩膀上眺望。行业内常把这种可总结和复用的经验叫做思考框架。一个好的思考框架,首先应该满足易学。如果大部分人都掌握不了,那它只是少部分人的术。让初读的人觉得优雅,能够用一句话解释清楚,就不必用整篇文章赘述。其次要满足易用。框架之所以称为框架,它只是骨,内里的血肉能因不同

2018-01-24 00:00:00 648

转载 R语言和 Python —— 一个错误的分裂

文章来源:开源中国最近有一些文章提出与年龄相关的问题:“崭露头角的年轻数据科学家们是学习R语言还是Python更好?”答案似乎都是“视情况而定”,在现实中没有必要在R和Python中做出选择,因为你两个都用得到。它被称为RPy2:http://rpy.sourceforge.net/rpy2/doc-2.1/html/introduction.html什么是”数据科学”?在谈论RPy2之前,先来说

2018-01-24 00:00:00 3399

转载 R语言可视化学习笔记之添加p-value和显著性标记

作者简介Introductiontaoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/往期回顾R语言学习笔记之聚类分析R语言可视化学习笔记之ggpubr包上篇文章中提了一下如何通过ggpubr包为ggplot图添加p-value以及显著性标记,本文将详细介绍。利用数据集ToothGrowth进行演示。#先加载包library(ggpubr)#加

2018-01-23 00:00:00 15027 2

转载 如何做好数据分析师的职业规划?

本文来源:数据分析不是个事儿p:不要错过文末的精彩嗷~~~~数据分析作为最近火热的细分行业,越来越受到大家的关注。但最近和一些数据分析师沟通时,大家都对自己的未来发展感到有些困惑。除了一路从初级数据分析师做到高级,最终走向团队管理外,未来数据分析师还有哪些职业成长空间,又需要提前做哪些方面的准备呢?笔者结合自己的工作经验给出一些看法。入门篇入数据分析这个行业有两个方向:业务与技术,可以选一个方向入

2018-01-23 00:00:00 1314

转载 【R语言】R是现在最好的数据科学语言吗?

本文来源:数据分析师R 语言是过去十年中发展最快的编程语言之一。事实上,如果你开始学习数据科学,我仍然推荐从 R 语言开始。所以,我想向你保证。R 语言绝对没有过时的。事实上,R 语言是非常受欢迎的而且是最好的数据语言。为此,我想解释为什么我对 R 语言的长期前景非常乐观,以及为什么我认为这也许是今天可以学习的最好的数据科学语言。R 语言始终是最好的语言之一我想让你们明白的一件事情是:目前 R 语

2018-01-22 00:00:00 2106

原创 R语言金融波动率建模|基于SGED分布的变参数ARIMA+EARCH动态预测模型的研究

作者简介Introduction齐祥会:某高校小硕一枚,“中金所杯”全国高校金融衍生品竞赛二等奖获得者,通过FRM(金融风险管理师)考试, 获得过全国赛、省赛、校赛量化投资团体赛及金融建模等前三等奖项,即将就职于某期货公司投资研究部,研究方向为股指期货、国债期货等,热爱使用R语言金融统计建模及可视化分析,希望能与行业大神有更多学习交流的机会!   基于SGED分布的变参数ARIMA+EARCH动态

2018-01-22 00:00:00 6841 1

转载 如何成为一名卓越的数据科学家 ——七剑之一:问题定义

关于作者:杨滔,桃树科技(TaoData)创始人,专注于下一代人工智能产品的研发、应用与商业化。拥有超过十年机器学习研究与应用经验。奥克兰大学机器学习博士,悉尼科技大学博士后。曾任阿里巴巴集团数据科学家,建立淘宝网数据科学团队,首创聚划算爆款模型。曾任F团首席科学家,建立F团数据化运营体系。 并非所有问题都可以用数据解决,数据也并非解决所有问题的万能钥匙。找到合适的问题,并将问题转化为适合用数据解

2018-01-20 00:00:00 466

原创 R语言可视化学习笔记之ggpubr包

作者简介Introductiontaoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/往期回顾R语言学习笔记之聚类分析Hadley Wickham创建的可视化包ggplot2可以流畅地进行优美的可视化,但是如果要通过ggplot2定制一套图形,尤其是适用于杂志期刊等出版物的图形,对于那些没有深入了解ggplot2的人来说就有点困难了,ggplo

2018-01-19 00:00:00 5644 1

转载 饿了么发布2017外卖报告14亿中国人口味的“最大公约数”是这道菜

2017年刚刚过去,这一年,中国人的口味有了怎样的变化?全中国销量最受欢迎的外卖餐品是什么?人们都喜欢在外卖备注上写些啥?近日,饿了么独家发布《2017年中国互联网本地生活服务蓝皮书》,用大数据还原中国人在2017年的众生“吃相”。中国人众口难调?皮蛋瘦肉粥成为“最大公约数”数据显示,2017年本地生活服务市场交易规模依旧保持快速上升势头,第三季度单季交易额突破千亿。目前,本地生活服务市场用户规模

2018-01-19 00:00:00 928

转载 没想到,区块链竟然是这样的!

文章来源:韦物主义:新商业观察“区块链”概念已火。韦物主义发现,虽然大部分人对“区块链”好奇,甚至眼馋,但不少还处于不求甚解的懵逼阶段.....正好最近我一直在研究区块链,同时也见了几个圈内人深聊了下,就想为大家写一个“入门级”的区块链介绍文章。为了通俗易懂,我决定不惜自毁清誉,用充满荷尔蒙的比喻。因为韦物主义觉得,科技浪潮每次确实都性感得让人荷尔蒙爆炸啊。性(huang)感(bao)内容开始。以

2018-01-19 00:00:00 759

转载 异步加载的基本逻辑与浏览器抓包一般流程

作者简介Introduction杜雨:EasyCharts团队成员,R语言中文社区专栏作者。兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。往期回顾网易云课堂Excel课程爬虫思路左手用R右手Pyhon系列——趣直播课程抓取实战Python数据抓取与可视化实战——网易云课堂人工智能与大数据板块课

2018-01-18 00:00:00 1907 1

转载 你真的要收下这份大礼包!!

引言数据时代已经到来,但数据分析、数据挖掘人才却十分短缺,据全球顶尖管理咨询公司麦肯锡(McKinsey)一份详细分析报告显示:预计到 2018 年,大数据或者数据工作者的岗位需求将激增,其中大数据科学家的缺口在 14 万到 19 万之间,对于懂得如何利用大数据做决策的分析师和经理的岗位缺口则将达到 150 万!先来了解一下数据分析,就是以商业目的为驱动,所开展的获取数据、处理数据、分析数据、展示

2018-01-17 00:00:00 448

原创 R文本分类之RTextTools

作者简介Introduction黄耀鹏:R语言中文社区专栏作者,一名数据科学研究者及科普写作者。个人博客:http://yphuang.github.io/往期回顾R中的正则表达式及字符处理函数总结R字符串处理应用之邮件考勤自动化R爬虫之上市公司公告批量下载‍‍‍‍‍‍‍‍RTextTools简介古有曹植七步成诗,而RTextTools是一款让你可以在十步之内实现九种主流的机器学习分类器模型的文本

2018-01-17 00:00:00 2822

转载 21天实战人工智能系列:人工智能产品经理最佳实践(3)

往期回顾:21天实战人工智能系列:人工智能产品经理最佳实践(1)21天实战人工智能系列:人工智能产品经理最佳实践(2)1前言打算面向想从事人工智能产品经理职位的人,写一个系列的专题,对人工智能产品经理做一个全面的介绍,初步计划写21个专题,每天一篇,算是对自己的一种鞭策,每天的任务定性,定量,希望自己能够坚持下来。适应人群:想要转型做人工智能的传统产品经理;RD想要转型做AIPM的人群;一切想从事

2018-01-16 00:00:00 966 1

原创 R语言学习笔记之聚类分析

作者简介Introductiontaoyan:伪码农,R语言爱好者,爱开源。个人博客: https://ytlogos.github.io/使用k-means聚类所需的包:factoextracluster #加载包library(factoextra)library(cluster)l #数据准备使用内置的R数据集USArrests#load the datasetdata("USArrests

2018-01-16 00:00:00 5766

转载 今晚我准备用R语言爬下这几个视频网站!

今晚20:00~22:00R语言带你飞!导言网络数据抓取是数据科学中获取数据中的重要途径,但是一直以来受制于高门槛,都是专业程序员的专属技能。直到R语言和Python这种函数式编程语言的兴起,爬虫技能又重新引起数据分析人员的兴趣。但是从目前的发展趋势来看,数据科学中的爬虫使用者,一直都被Python语言把持着。Python中不仅有着urllib、requests这样优秀的网络请求库,而且有着像lx

2018-01-15 00:00:00 4208 1

转载 MatchingFrontier包简介及R实现

作者:赵毅 来源:个人微信公众号:数据分析14801.1 MatchingFrontier Package 简介      MatchingFrontier Package包由哈佛大学的Gary King和Christopher Lucas以及来自MIT的Richard Nielsen三位学者共同开发,该包于2015年首次发布在Github上,现在在CRAN上也可方便下载。      该包主要提供

2018-01-14 00:00:00 1575

转载 如何成为一名卓越的数据科学家——开篇七剑

关于作者:杨滔,桃树科技(TaoData)创始人,专注于下一代人工智能产品的研发、应用与商业化。拥有超过十年机器学习研究与应用经验。奥克兰大学机器学习博士,悉尼科技大学博士后。曾任阿里巴巴集团数据科学家,建立淘宝网数据科学团队,首创聚划算爆款模型。曾任F团首席科学家,建立F团数据化运营体系。“如何成为一名卓越的数据科学家?”是我们讨论的主题。 所谓卓越,不是那些纸上谈兵、喜欢“3V”、“4D”、“

2018-01-13 00:00:00 793

转载 用R语言照葫芦画瓢撸了一个简易代理~

作者简介Introduction杜雨:EasyCharts团队成员,R语言中文社区专栏作者。兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。往期回顾R语言数据抓取实战——RCurl+XML组合与XPath解析R语言网络数据抓取的又一个难题,终于攻破了!往期案例数据请移步本人GitHub:http

2018-01-12 00:00:00 1754

转载 21天实战人工智能系列:人工智能产品经理最佳实践(2)

往期回顾:21天实战人工智能系列:人工智能产品经理最佳实践(1)1前言打算面向想从事人工智能产品经理职位的人,写一个系列的专题,对人工智能产品经理做一个全面的介绍,初步计划写21个专题,每天一篇,算是对自己的一种鞭策,每天的任务定性,定量,希望自己能够坚持下来。适合人群想要转型做人工智能的传统产品经理;RD想要转型做AIPM的人群;一切想从事或了解人工智能产品经理工作的人;屏蔽人群:希望通过本课程

2018-01-12 00:00:00 977 1

转载 用R语言实现深度学习情感分析

作者简介Introduction黄升:普兰金融数据分析师,从事数据分析相关工作,擅长R语言,热爱统计和挖掘建模。来源:个人微信公众号:数据分析1480往期回顾手把手教你使用R语言做评分卡模型前言到了2018新的一年。18岁虽然没有成为TF-boys,但是2018新的一年可以成为TF(Tensorflow-boys)啊~~~word embeddings介绍      之前建立的情感分类的模型都是B

2018-01-11 00:00:00 7818 2

转载 21天实战人工智能系列:人工智能产品经理最佳实践(1)

1前言打算面向想从事人工智能产品经理职位的人,写一个系列的专题,对人工智能产品经理做一个全面的介绍,初步计划写21个专题,每天一篇,算是对自己的一种鞭策,每天的任务定性,定量,希望自己能够坚持下来。适合人群想要转型做人工智能的传统产品经理;RD想要转型做AIPM的人群;一切想从事或了解人工智能产品经理工作的人;屏蔽人群:希望通过本课程学习编码能力的人。2正文章节目标了解是什么是人工智能?了解人工智

2018-01-10 00:00:00 2415 3

原创 R语言数据可视化---交互式图表recharts包

作者简介Introduction邬书豪:车联网数据挖掘工程师 ,人工智能爱好者社区负责人。微信ID:tsaiedu知乎专栏:https://www.zhihu.com/people/wu-shu-hao-67/activities 往期回顾R可视化分析链家网南京楼市数据kaggle案例:数据科学社区调查报告(附学习视频)kaggle案例:员工离职预测(附学习视频)Kaggle案例~R可视化分析美国

2018-01-10 00:00:00 2429

转载 R语言数据清洗实战——高效list解析方案

作者简介Introduction杜雨:EasyCharts团队成员,R语言中文社区专栏作者。兴趣方向为:Excel商务图表,R语言数据可视化,地理信息数据可视化。个人公众号:数据小魔方(微信ID:datamofang) ,“数据小魔方”创始人。往期回顾R语言数据清洗实战——世界濒危遗产地数据爬取案例往期案例数据请移步本人GitHub:https://github.com/ljtyduyu/Data

2018-01-09 00:00:00 5134

原创 2017年R语言发展报告(国内)

Tips:本报告数据采集于R语言中文社区历史数据及互联网公开数据,由黄小伟整理汇总,如有不当之处,欢迎批评指正!参考数据:1.IEEE编程语言排行:https://spectrum.ieee.org/computing/software/the-2017-top-programming-languages2.中国R语言会议数据:http://china-r.org/history.html3.统计

2018-01-08 00:00:00 2424

转载 手把手教你使用R语言做评分卡模型

作者:黄升,普兰金融数据分析师,从事数据分析相关工作,擅长R语言,热爱统计和挖掘建模。来源:个人微信公众号:数据分析1480目录使用Logistic和NaiveBayes建模Score Card原理Naive Bayes评分卡Logistics评分卡前言      信用评分是指根据客户的信用历史资料,利用一定的信用评分模型,得到不同等级的信用分数。根据客户的信用分数, 授信者可以分析客户按时还款的

2018-01-07 00:00:00 5239 1

原创 数据分析是怎样的?

作者简介Introduction杨奉山:R语言中文社区专栏作者,R语言小学生,和我一起为成为优秀的商业数据分析师努力吧 知乎专栏:https://zhuanlan.zhihu.com/YFSbda 往期回顾我的商业数据分析成长之路(书籍方面) | 引言为什么游戏内销售额会下降 | R语言商业分析实践(1)这个月本手游活跃度下降了 | R语言商业分析实践2广告投入是怎样提高新用户数的(岭回归及主成分

2018-01-06 00:00:00 1007

转载 汽车行业大数据应用分析

物联网的发展带来各种新的概念甚至新的“物种”,车联网有机会变成物联网具体应用的急先锋。未来5-8年汽车产业将会真正进入大数据时代首先是汽车本身智能化,各种传感器的应用,提供了庞大的数据来源,包含车辆寿命周期信息、车型特征信息、车主的行为信息等,甚至座椅的使用习惯都会形成相应的数据;还有就是以车为中心的数据化、零部件、车况、维修保养、交通、地理位置等信息都会形成庞大的数据被挖掘应用而产生价值。其次,

2018-01-06 00:00:00 9717

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除