自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(12)
  • 资源 (7)
  • 收藏
  • 关注

原创 机器学习与R之支持向量机svm-svr(下)

e1071包的svm()函数library(lattice)  xyplot(Petal.Length ~ Petal.Width, data = iris, groups = Species, auto.key=list(corner=c(1,0)))  #查看散点图第一种是根据既定公式建立模型svm(formula, data= NULL, subset, na.action

2016-07-28 18:04:32 8480

原创 机器学习与R之支持向量机svm(上)

支持向量机svm e1071包的svm()函数提供R和LIBSVM的接口library(kernlab)letter_classifier                           kernel = "vanilladot",C = 1)kernel非线性映射函数(rbfdot径向基polydot多项式tanhdot双曲正切vanilladot线性函数等等)C用于

2016-07-26 18:05:26 1846

原创 机器学习与R之BP神经网络

归一化normalize   return((x - min(x)) / (max(x) - min(x)))}lapply应用到数据框每一列concrete_norm library(neuralnet)用法concrete_model                               ash + water + superplastic +  

2016-07-26 17:32:50 2945

原创 机器学习与R之回归树CART与模型树M5

根据SDR标准偏差减少-来选择特征sdr_a 回归树CART-叶子节点利用的是均值rpart(formula, data, weights, subset, na.action = na.rpart, method,      model = FALSE, x = FALSE, y = TRUE, parms, control, cost, ...)control算法细节  

2016-07-23 18:52:04 8848

原创 机器学习与R笔记之线性回归

普通最小二乘法OLSy=ax+b     f(e)=sum((y-y')^2) b=cor(x,y)/var(x)  #证明省略 协方差/方差a=mean(y)-b*mean(x)person相关系数R=cor(x,y)多元线性回归Y=XB+EYBE为向量X为带偏执矩阵--最小二次法求系数B=solve((t(x)%*%x))%*%t(x)%*%y估计B的函

2016-07-23 18:00:46 1317 1

原创 Python机器学习与实战笔记之逻辑斯蒂回归Logistic Regression, LR

理论参考-特别是梯度下降权值更新向量化的过程http://www.cnblogs.com/nsnow/p/4540700.htmlhttp://blog.csdn.net/zouxy09/article/details/203196731定义特征与标签矩阵2定义sigmoid函数3根据推出的权值更新公式进行迭代-最后算出权值可选的训练方式有梯度上升,随机梯度上升,改进的随机

2016-07-23 10:16:14 1092

原创 广义径向基神经网络

2016-07-21 20:44:18 1441

原创 阿里音乐流行趋势预测大赛-赛后思路整理

赛题介绍阿里音乐用户的历史播放数据预测阿里音乐平台艺人的未来60天的播放量最后top151从图入手:查看规律与趋势2提出问题:为什么会出现特别高的播放量?是否有一定的节假日工作日规律?不同歌手建模还是单独歌手建模或者歌曲建模?不同歌手趋势是否相同?3解决问题为什么会出现特别高的播放量?--发现两种情况:1有人刷单2有新歌发布是否有一定的节假日

2016-07-21 20:15:32 2979 2

原创 linux下离线安装mysql

centos离线安装mysql首先去http://dev.mysql.com/downloads/mysql/5.5.html#downloads站点下载:分别下载以下三个文件(由于我的机器是32位,下面是32位版本的包,如果你的机器是64位的请下载64位版本):MySQL-devel-5.5.50-1.linux2.6.x86_64.rpmMySQL-client-5.5

2016-07-12 11:09:39 3044

原创 maven-pom中配置多个远程仓库-编码gbk的不可映射字符

1、maven 仓库地址:  共有的仓库  http://repo1.maven.org/maven2/  http://repository.jboss.com/maven2/  http://repository.sonatype.org/content/groups/public/  http://mirrors.ibiblio.org/pub/mirrors/maven

2016-07-04 15:18:28 2357

原创 机器学习实战之决策树ID3算法

决策树ID3信息增益-熵C4.5信息增益率CART基尼系数+后剪枝ID3算法1先计算经验熵--(熵越高,则混合的数据也越多,即同一特征不同情况越多)首先计算数据集中实例的总数创建一个数据字典-每个键值都记录了当前类别出现的次数-出现的类别key-次数value使用所有类标签的发生频率计算类别出现的概率-遍历key 次数/总数 累计 sum-=sum-log2(p)2切分

2016-07-02 11:41:18 733

原创 机器学习与R之决策树C50算法

决策树经验熵是针对所有样本的分类结果而言经验条件熵是针对每个特征里每个特征样本分类结果之特征样本比例和基尼不纯度简单地说就是从一个数据集中随机选取子项,度量其被错误分类到其他分组里的概率决策树算法使用轴平行分割来表现具体一定的局限性C5.0算法--可以处理数值型和缺失 只使用最重要的特征--使用的熵度量-可以自动修剪枝划分数据集set.seed(123) #

2016-07-02 11:39:10 10819 1

阿里平台MR

阿里御膳房平台MR示例代码-数加平台OPEN_MR示例

2016-06-16

阿里菜鸟仓库比赛说明

阿里菜鸟仓库比赛说明

2016-06-01

MATLAB神经网络原理与实例精解pdf

MATLAB神经网络原理与实例精解pdf书籍,留的是百度网盘,高清PDF,文件大于60MB,全书齐,神经网络学习必备

2016-03-17

Ambari安装

关于Ambari安装过程,亲测可用,Hadoop集群监控

2015-12-30

HADOOP实战__陆嘉恒著

机械工业出版社 HADOOP实战 陆嘉恒著

2015-10-30

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除