自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 资源 (3)
  • 收藏
  • 关注

原创 基于Spark ALS算法的个性化推荐

今天来使用spark中的ALS算法做一个小推荐。需要数据的话可以点击查看初识sparklyr—电影数据分析,在文末点击阅读原文即可获取。其实在R中还有一个包可以做推荐,那就是recommenderlab。如果数据量不大的时候可以使用recommenderlab包,之前也用该包做过电影评分预测模型(点击即可查看)。如果数据量较大还是推荐使用spark来进行计算。在spark中包含...

2018-05-18 21:55:12 3567

原创 爬虫 | 正则表达式提取腾讯教育新闻链接及图片链接

前面的爬虫都是通过标签来爬取的,今天就分享一个小例子使用正则表达式来提取网页信息。如果你对正则表达式不熟悉,可以查看我之前写的R正则表达式这篇文章。它对R几个常用正则表达式进行了详尽的解释,包括参数说明,函数区别,正则表达式转义等都有介绍。今天通过爬取腾讯教育(http://edu.qq.com/)网页的所有关于教育新闻的链接,另外也爬取图片链接。提取新闻链接首先我们来分析一些教育类新闻链接的特点...

2018-05-18 18:50:29 1685

原创 R语言 赋值符号 的区别

R语言赋值可以用=或<-,一般都建议使用<-,那你知道这两个之间的区间吗?那你有没有见过‘<-’和‘=’这种赋值方法吗?今天就来和大家聊聊这基本的赋值符号都有哪些区别。首先我们来看看符号的优先级,和java,c这些编程语言的优先级类似。下面这些都取自R帮助文档,输入?Syntax即可查看,它是根据优先级从高到低排列的。:: :::    access variables in a...

2018-05-18 18:48:30 8390

原创 中文乱码,也许这个小技巧可以帮到你

我们都知道R对中文是真的很不友好。即使把encoding设置成UTF-8还是GBK等,它有时不听话的还是依旧乱码。有人说在设置里面把默认字符集编码设成utf-8,不过试了,没用!比如我原本数据是左边这种这个样子,读到R里面却成了右边这个样子。这该情何以堪啊,我待R如初恋,R却虐我千万遍。虽然在Linux系统下使用Libreoffice calc打开时,可以选择字符集类型,只要选择合适的字符是不会乱...

2018-05-18 18:44:57 6097 3

预测分析中的建模技术:商务问题与R语言解决方案 数据

预测分析中的建模技术:商务问题与R语言解决方案 书籍所有数据及代码.

2016-11-12

R语言maps程序包帮助文档

该文件是R语言中maps包的帮助文档,其中包含了maps中函数有哪些,具体参数如何使用,使用该文档可以帮助我们更好地了解学习maps程序包。

2016-03-09

R语言函数使用说明

详细介绍R语言函数的作用以及使用方法。比如 header:逻辑参数。指定是否文件第一行为变量名。 na.strings:指定缺失文字。 skip:指定读数据跳过的行数。 nrows:指定数据读入最大的行数。 dec:指定小数点记号。

2016-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除