自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(23)
  • 收藏
  • 关注

转载 PCA主成分分析

PCA步骤:(1)对原始数据进行标准化处理(2)计算样本相关系数矩阵(3)计算相关系数矩阵R的特征值和相应的特征向量(4)选择重要的主成分,写出主成分表达式案例问题:企业综合实力排序企业综合实力评价表:企业序号净利润率/%固定资产利润率/%总产值利润率/%销售收入利润率/%产品成本利润率/%物耗利润

2017-04-26 15:48:32 864

转载 R语言主成分和因子分析

主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量称为主成分。探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法,通过寻找一组更小 的、潜在的或隐藏的结构来解释已观测到的、变量间的关系。1.R中的主成分和因子分析R的基础安装包中提供了PCA和EFA的函数,分别为princomp ()和factanal()

2017-04-25 19:51:31 2378

转载 R语言回归分析

1.回归的多面性回归类型用途简单线性个量化的解释变量来预测一个量化的响应变量(一个因变量、一个自变量)多项式一个量化的解释变量预测一个量化的响应变量,模型的关系是n阶多项式(一个预测变量,但同时包含变量的幂)多元线性用两个或多个量化的解释变量预测一个量化的响应变量(不止一个预测变量)多变量   用一个或

2017-04-25 19:50:08 21096 1

原创 机器学习实例-线性回归模型

#第五章:线性回归模型   数据下载地址:https://github.com/johnmyleswhite/ML_for_Hackerslibrary(ggplot2)ages ggplot(ages,aes(x = AgeAtDeath,fill = factor(Smokes))) + geom_density()+facet_grid(Smokes~.)     

2017-04-22 21:23:02 932

转载 R语言中进行文件夹操作范例注释(转)

R语言中进行文件夹操作范例注释(转)rm(list=ls())path = 'J:/lab/EX29 --在R语言中进行文件(夹)操作'setwd(path)cat("file A\n", file="A") #创建一个文件A,文件内容是'file A','\n'表示换行,这是一个很好的习惯cat("file B\n", file="B")  #创建一个

2017-04-19 15:47:25 1814

原创 机器学习实例第二章:数据分析

#机器学习实例第二章:数据分析height.weight                              sep = ",",header = TRUE )summary(height.weight)#仅查看heights.weights中的height的各个值heights summary(heights)#计算均值的函数:把向量

2017-04-19 15:29:25 448

转载 Nature:深度学习的现在和未来:DeepLearning、无监督学习、NLP

Nature:深度学习的现在和未来:DeepLearning、无监督学习、NLP【编者按】三大牛Yann LeCun、Yoshua Bengio和Geoffrey Hinton在深度学习领域的地位无人不知。为纪念人工智能提出60周年,最新的《Nature》杂志专门开辟了一个“人工智能 + 机器人”专题 ,发表多篇相关论文,其中包括了Yann LeCun、Yo

2017-04-17 16:01:46 5045

转载 R语言推荐算法

library(recommenderlab)library(ggplot2)# data(MovieLense)dim(MovieLense)## [1] 943 1664MovieLense## 943 x 1664 rating matrix of class 'realRatingMatrix' with 99392 ratings.image(sample(MovieL

2017-04-17 10:55:01 2470

转载 R利用卷积神经网络做预测

深度学习在过去几年,由于卷积神经网络的特征提取能力让这个算法又火了一下,其实在很多年以前早就有所出现,但是由于深度学习的计算复杂度问题,一直没有被广泛应用。一般的,卷积层的计算形式为:其中、x分别表示当前卷积层中第j个特征、前一层的第i个特征;k表示当前层的第j个特征与前一层的第i个特征之间的卷积核;M表示需要卷积的前一层的特征的集合,b表示当前卷积层中第j个卷积核对应

2017-04-15 21:34:57 12763

原创 机器学习实例第一章

#机器学习实例1#read.delim在读函数时,会默认把字符串装换为factor的类型,这个类型是用来表示分类变量的,因此需要设置#stringAsFactor=FALSE来防止其转换,此外,这份数据第一行并没有表头,因此还需要把表头的参数设置为false#以防止R把第一行当成表头,最后,数据中有许多空元素,要把这些空元素设置为R中的=特殊值NA,定义显式的空字符串为#n

2017-04-15 20:23:56 346

原创 ggpolt做图1

#使用ggplot里面的qplot作图library(ggplot2)qplot(Wind,Temp,data = airquality,color = Month)#每个月分的颜色不一样,对应每个月是一个颜色渐变条qplot(Wind,Temp,data = airquality,shape = Month) # 把形状赋值给Month,因此每个月点的形状不一样 

2017-04-15 20:20:18 782

转载 R语言系列:datasets(R自带数据包)

向量euro    #欧元汇率,长度为11,每个元素都有命名landmasses    #48个陆地的面积,每个都有命名precip    #长度为70的命名向量rivers    #北美141条河流长度state.abb    #美国50个州的双字母缩写state.area    #美国50个州的面积state.name    #美国50个州的全称因子stat

2017-04-14 20:43:56 6415

转载 数据分析 R语言实战 学习笔记 第三章 数据预处理

数据分析 R语言实战  学习笔记 第三章 数据预处理 (下)3.3 缺失值处理R 中缺失值以NA 表示,判断数据是否存在缺失值的函数有两个,最基本的函数是is.na() 它可以应用于向量、数据框等多种对象,返回逻辑值。> attach(data)The following objects are masked fromdata (pos = 3):c

2017-04-14 16:27:06 3022

转载 ARIMA时间序列分析

1. 处理数据1.1. 导入forecast包forecast包是一个封装的ARIMA统计软件包,在默认情况下,R没有预装forecast包,因此需要先安装该包> install.packages("forecast')导入依赖包zoo,再导入forecast包> library("zoo")> library("forecast")1.2. 导入数据

2017-04-14 16:24:43 2003

转载 完整的R语言预测建模实例-从数据清理到建模预测

本文使用Kaggle上的一个公开数据集,从数据导入,清理整理一直介绍到最后数据多个算法建模,交叉验证以及多个预测模型的比较全过程,注重在实际数据建模过程中的实际问题和挑战,主要包括以下五个方面的挑战:缺失值的挑战异常值的挑战不均衡分布的挑战(多重)共线性的挑战预测因子的量纲差异  以上的几个主要挑战,对于熟悉机器学习的人来

2017-04-14 16:22:12 6183 4

转载 R全面解析Mahout的基于用户推荐协同过滤算

前言用R全面解析Mahout的基于用户推荐协同过滤算法(UserCF),改进的采用欧氏距离,并用R语言实现,与Mahout的结果进行对比。Mahout是Hahoop家族用于机器学习的一个框架,包括三个主要部分,推荐,聚类,分类!我在这里做的是推荐部分。推荐系统在现在的互联网应用中很常见,比如,亚马逊会推荐你买书,豆瓣会给你一个书评,影评。由于时间仓促,欢迎大家一起讨论。

2017-04-14 16:17:10 408

转载 最优化方法matlab实现

优化问题测试函数: http://www-optima.amp.i.kyoto-u.ac.jp/member/student/hedar/Hedar_files/TestGO.htm9.1  概   述     利用Matlab的优化工具箱,可以求解线性规划、非线性规划和多目标规划问题。具体而言,包括线性、非线性最小化,最大最小化,二次规划,半无限问题,线性、非线性方

2017-04-13 11:32:54 43639

转载 RBM应用于推荐系统

不错的一篇文章,将RBM应用于推荐系统摘要:与传统的浅层机器学习相比,深度学习具有优秀的自动提取抽象特征的能力,并且随着分布式计算平台的快速发展,大数据的处理能力得到极大的提升,使得近年来DL在工程界得到广泛的应用,包括图像识别,语音识别,自然语言处理等领域,并取得比传统机器学习更好的效果提升。另一方面,智能推荐系统,本质上是从一堆看似杂乱无章的原始流水数据中,抽象出用户的兴趣因子,挖掘出

2017-04-13 11:29:30 5470

转载 余弦计算相似度度量【转】

余弦计算相似度度量【转】  (2014-11-17 10:18:40)转载▼http://blog.csdn.net/u012160689/article/details/15341303余弦计算相似度度量相似度度量(Similarity),即计算个体间的相似程度,相似度度量的值越小,说明个体间相似度越小,相似度的值越大说明个体差异越大。

2017-04-13 11:25:17 3487 3

转载 推荐系统

1.推荐系统的第一步你认为是做什么,本文是如何认为的?2.相似度在推荐系统中起着什么作用?3.什么是数据标准化(归一化)处理?4.找到某观影人可能喜欢的电影,找到对某影片感兴趣的人的思路是什么?似乎咱的产品七,八年前就想做个推荐系统的,就是类似根据用户的喜好,自动的找到用户喜欢的电影或者节目,给用户做推荐。可是这么多年过去了,不知道是领导忘记了还是怎么了,连个影子还没见

2017-04-13 11:21:06 861

转载 机器学习实用案列3

第3章  分类:垃圾过滤#machine learing for heckers #chapter 312library(tm)library(ggplot2)  #设置路径变量123456

2017-04-13 11:17:42 444

转载 R语言吴恩达机器学习课后习题

练习2-线性回归# read data: x is age, y is heightx y colnames(x) colnames(y) # scatter plotinput library(ggplot2)p p + geom_point(size=3,shape=3) + theme_bw() + xlab("Age in years

2017-04-09 20:31:58 1433

转载 R中的sample函数

今天介绍一些运算函数,它们的使用很简单,没有什么难度,但是也会用的着。在医学统计学或者流行病学里的现场调查、样本选择经常会提到一个词:随机抽样。随机抽样是为了保证各比较组之间均衡性的一个很重要的方法。那么今天介绍的第一个函数就是用于抽样的函数sample:> x=1:10> sample(x=x) [1]  3  5  9  6 10  7  2  1  8  4

2017-04-09 20:14:18 79529 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除