自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 收藏
  • 关注

原创 MySQL联合索引

联合索引:建立在同一个表多个上的索引,可以包含char和varchar列的前缀作为所以的一部分。联合索引的列的顺序非常重要:利用索引中的附加列,您可以缩小搜索的范围,但使用一个具有两列的索引 不同于使用两个单独的索引。复合索引的结构与电话簿类似,人名由姓和名构成,电话簿首先按姓氏对进行排序,然后按名字对有相同姓氏的人进行排序。如果您知道姓,电话簿将非常有用;如果您知道姓和名,电话簿则更为有用,

2015-10-26 09:18:48 686

原创 R语言:k近邻

head(iris)##该数据集都是连续变量的#数据标准化处理normalize = function(x){ (x-min(x))/(max(x)-min(x))}iris_norm = as.data.frame(lapply(as.list(iris[,1:4]),normalize))#构造训练集合测试集set.seed(1234)ind=sample(2,nrow(iris),repla

2015-08-01 15:43:00 1535 1

原创 R语言:初试logitstic

#用数据集iris,鸢尾花的例子来说明data(iris)head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species1 5.1 3.5 1.4 0.2 setosa2 4.9 3.0

2015-07-31 17:09:17 5164

原创 R语言:关联规则(apriori)

本文数据是来自datacastle网站上的一道竞赛题,是基于关联规则进行商品推荐之类的题目数据集中还包含了对商品的评分和购买时间两个额外变量,下面这篇文章并没有使用到这一个变量,特别是对商品的评分这个变量,包含了很多有用的信息。所以说,这篇文章还是一个半成品,有空会补上。#读入数据data = read.csv("数据.csv",stringsAsFactors=F

2015-06-21 22:17:44 7407

原创 R语言:词云图

这是当时在琢磨文本挖掘时的小技术,贴出来共享一下

2015-06-07 09:09:20 9235 4

原创 R语言做时间序列(未完)

我学的时间序列课程,实验课都是在sas做的,一直想用R把大概的思路捋顺一下,所以这篇东西并没有给出很多的程序结果,更多地设计做时间序列的思路

2015-06-06 19:28:25 13398 3

原创 R语言做文本挖掘:基于网购评论提炼电热水器的差异化卖点

这是我参加一个数据挖掘竞赛的作品,这是代码部分,论文正文并没有贴出来。水平一般般,很多还可以改进的地方。不过辛辛苦苦做出来的东西,多少还是有些地方可以借鉴的,贴出来大家共同探讨下。

2015-06-06 19:20:29 2906 2

原创 Rcurl小应用,爬取京东评论

利用Rcurl包做的一个小爬虫,爬取了京东上电热水器的评论

2015-06-06 16:42:26 4228 3

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除