自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(13)
  • 收藏
  • 关注

转载 R学习笔记——wordcloud包制作词云图

一、.wordcloud包的函数介绍 1.wordcloud函数用于制作常规的词云图 wordcloud(words,freq,scale=c(4,.5),min.freq=3,max.words=Inf,random.order=TRUE, random.color=FALSE, rot.per=.1,colors=black,ordered.colors=FALSE,use.r.layout=

2016-07-25 11:26:25 2146

转载 R语言与数据挖掘学习笔记(常用的包)

今天发现一个很不错的博客(http://www.RDataMining.com), 博主致力于研究R语言在数据挖掘方面的应用,正好近期很想系统的学习一下R语言和数据挖掘的整个流程,看了这个博客的内容,心里久久不能平静。决定从今天 开始,只要晚上能在11点之前把碗洗好,就花一个小时的时间学习博客上的内容,并把学习过程中记不住的信息记录下来,顺便把离英语四级的差距尽量缩小。下面列出了可用于

2016-07-25 11:24:19 410

转载 R语言与分类算法的绩效评估

关于分类算法我们之前也讨论过了KNN、决策树、naivebayes、SVM、ANN、logistic回归。关于这么多的分类算法,我们自然需要考虑谁的表现更加的优秀。既然要对分类算法进行评价,那么我们自然得有评价依据。到目前为止,我们讨论分类的有效性都是基于分类成功率来说的,但是这个指标科学吗?我们不妨考虑这么一个事实:一个样本集合里有95个正例,5个反例,分类器C1利用似然的思想将所有的实

2016-07-25 11:22:55 2618

转载 R语言与机器学习学习笔记(分类算法)(6)logistic回归

由于我们在前面已经讨论过了神经网络的分类问题(参见《R语言与机器学习学习笔记(分类算法)(5)》),如今再从最优化的角度来讨论logistic回归就显得有些不合适了。Logistic回归问题的最优化问题可以表述为:寻找一个非线性函数sigmoid的最佳拟合参数,求解过程可使用最优化算法完成。它可以看做是用sigmoid函数作为二阈值分类器的感知器问题。今天我们将从统

2016-07-25 11:21:17 14713

转载 R语言与机器学习学习笔记(分类算法)(5)神经网络

算法五:神经网络(优化算法) 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是算法五:神经网络(优化算法) 人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和

2016-07-25 11:19:46 4138

转载 R语言与机器学习学习笔记(分类算法)(4)支持向量机

算法四:支持向量机 说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,个人感觉再怎么写也不可能写得比他更好的了。这也正如青莲居士见到崔颢的黄鹤楼后也只能叹“此处有景道不得”。不过我还是打算写写SVM的基本想法与libSVM中R的接口。一、SVM的想法 回算法四:支持向量机 说到支持向量机,必须要提到july大神的《支持向量机通俗导论》,

2016-07-25 11:18:45 1127

转载 R语言与机器学习学习笔记(分类算法)(3)朴素贝叶斯

算法三:朴素贝叶斯算法 前两个算法都被要求做出一个艰难的决定,给出数据所属分类的明确答案,但往往因为分类特征统计不足,或者分类特征选择有误导致了错误的分类结果,哪怕是训练集也有可能出现不能正确分类的情形。这时,前两种方法都如同现实生活一样是用“少数服算法三:朴素贝叶斯算法 前两个算法都被要求做出一个艰难的决定,给出数据所属分类的明确答案,但往往因为分

2016-07-25 11:16:16 1898

转载 R语言与机器学习学习笔记(分类算法)(2)决策树算法

算法二:决策树算法 首先,我们来谈谈什么是决策树。我们还是以鸢尾花为例子来说明这个问题。 观察上图,我们判决鸢尾花的思考过程可以这么来描述:花瓣的长度小于2.4cm的是setosa(图中绿色的分类),长度大于1cm的呢?我们通过宽度来判别,宽度小于1.8cm的是versicolo算法二:决策树算法 决策树定义 首先,我们来谈谈什么是决策树

2016-07-25 10:59:36 7540

转载 R语言与机器学习学习笔记(分类算法)(1)K-近邻算法

前言 最近在学习数据挖掘,对数据挖掘中的算法比较感兴趣,打算整理分享一下学习情况,顺便利用R来实现一下数据挖掘算法。 数据挖掘里我打算整理的内容有:分类,聚类分析,关联分析,异常检测四大部分。其中分类算法主要介绍:K-近邻算法,决策树算法,朴素贝叶斯算法前言 最近在学习数据挖掘,对数据挖掘中的算法比较感兴趣,打算整理分享一下学习情况,顺便利用R来实现

2016-07-25 10:58:27 3120

原创 假设检验

假设检验 V.S 显著性检验假设检验(Hypothesis Testing)是数理统计学中根据一定假设条件由样本推断总体的一种方法。用来判断样本与样本,样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。显著性检验(significance test)只是假设检验中最常用的一种方法。显著性检验就事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这

2016-07-19 18:01:46 2087

原创 动态规划--最小调整代价

91. Minimum Adjustment Cost【题目】Given an integer array, adjust each integers so that the difference of every adjacent integers are not greater than a given number target.If the array before

2016-07-10 22:12:57 4842 1

原创 动态规划--背包问题

92. BackpackGiven n items with size Ai, an integer m denotes the size of a backpack. How full you can fill this backpack?在n个物品中挑选若干物品装入背包,最多能装多满?【样例】如果有4个物品[2, 3, 5, 7]如果背包

2016-07-05 22:13:56 1594

原创 概率统计分布模型

概率统计分布模型1.离散概率分布 !)泊松分布 描述是单位时间(面积)内随机事件发生的次数。 【满足条件】 a.平稳性:任意时间区间内,事件发生k次的概率只依赖于区间长度 b.独立性:在不重叠的时间段内,事件的发生是相互独立的 c.小概率事件 【概率函数】 期望和方差均为λ 【应用场景】 a.某一服务设施在一定时间内到达的人数,接待人数 b.电话交换机接到呼叫的次数 c.

2016-07-05 18:23:16 8769 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除