
R语言
文章平均质量分 63
饭饭认认米
A fool smile in fall!
展开
-
排行模型验证的方式
前言模型的实现固然重要,但是模型的验证也是不可或缺的一块。只有模型,没有验证就行代码不经测试直接上线一样的道理,质量是无法保证的。原创 2016-08-03 15:59:22 · 898 阅读 · 0 评论 -
聚类算法总结
最近整理一下聚类相关的东西;数据说明凸集:在欧氏空间中,凸集是对于集合内的每一对点,连接该对点的直线段上的每个点也在该集合内;非凸(non-convex)数据:类比上述可知;距离&相似度首先我们要了解衡量对象间差异的方法对象可能是一个值,也可能是序列,聚类的方式的大都通过距离或相似度来衡量,常用距离如下: 对于两个对象的n维指标(x1,x2,….xn)|(y1,y2,…原创 2016-11-23 18:40:01 · 1985 阅读 · 0 评论 -
分类数据聚类&决策树探索聚类因素-R语言
聚类&决策树原创 2017-07-21 14:24:03 · 1758 阅读 · 0 评论 -
绘制累积分布图-R语言
绘制累积分布图原创 2017-07-18 16:00:23 · 24983 阅读 · 1 评论 -
随机森林原理-R语言简单实例
随机森林是基于决策树的组合模型,若因变量为分类变量则建立分类判别模型,若为连续变量则建立非线性回归分析模型。随机森林在分类中返回得票数最多的分类选项,在回归中返回所有决策树输出的平均值。随机森林是由多个回归树组合而成的模型,广泛用于分类研究,随机森林回归能够有效的分析非线性、具有共线性和交互作用的数据,效果要优于多元线性回归,并且不需要预先给定模型的形式假定,回归效果比回归树更好。随机森林在实际应用原创 2017-04-07 19:34:37 · 25844 阅读 · 5 评论 -
绘制地图&热力图-R语言
对于地域信息的描述,采用地图的形式展现会比语言描述或者一般的条形图、饼图更直观,近期需要展现不同地区数据差别,可以借鉴一些网站例如地图惠等导入数据制作,但很多都有一定限制,例如注册收费等,故利用R进行了绘制。参考openthings的博客成功制作出了漂亮的地图,他的博客写的很详细,很赞。原创 2016-09-17 21:11:08 · 37223 阅读 · 36 评论 -
复杂网络笔记-R语言
最近学习了下复杂网络相关的东西,总结了部分基础的理论,与使用R语言igraph包,总结如下,还需要继续深入,目前只学了皮毛。原创 2016-08-25 14:21:58 · 32075 阅读 · 5 评论 -
文件夹下批处理excel-R语言
R语言处理excel文件原创 2016-09-21 23:11:57 · 2908 阅读 · 0 评论 -
分词及词云图绘制-R语言
分词的方法模型很多种,最大概率法、隐式马尔可夫模型、索引模型以及混合模型等,字典的类型也分为很多种,混合模型的结果一般情况下效果较优,下面利用R语言简单绘制云图,达到可视化的效果。原创 2016-09-18 22:59:12 · 8990 阅读 · 1 评论 -
网页数据爬虫-R语言
最早接触爬虫是利用java写脚本,后来自学了利用python进行爬虫来做入门,会用scrapy,最近用了下R,找了几个不同类型的字段获取,当作好玩吧。原创 2016-09-18 21:53:11 · 11276 阅读 · 0 评论 -
面板数据分析步骤及流程-R语言
面板数据模型选择及分析步骤;附R语言代码原创 2016-08-16 16:49:55 · 111138 阅读 · 28 评论 -
冷却算法综合排名改进模型-R实现代码
近期对投票模型中的牛顿冷却模型结合具体数据及含义进行了改进,并通过R语言进行了实现,模型逻辑并不复杂,在之后的博文中会添加上去,代码中存在各种条件句是由于实际可操作数据中存在各种情况,数据来源于爬虫累计数据。原创 2016-07-22 22:06:34 · 778 阅读 · 0 评论 -
ARIMA模型-R语言
利用ARIMA模型进行时间序列预测。原创 2016-08-07 11:44:53 · 6382 阅读 · 1 评论 -
R语言try函数
简介 利用R语言进行编程的时候,想像java里面一样类似采用try···catch的方式捕捉错误。平时对于一些错误的处理方式一般都是用if···else来处理,但是有些情况if···else操作起来并不是那么顺溜。原创 2016-08-07 13:26:35 · 16360 阅读 · 0 评论