机器学习
一个脱离了高级趣味的人
这个作者很懒,什么都没留下…
展开
-
knn算法
英文全称k-nearst-neighbors 这是一个分类算法 工作原理: 比如,有一堆先验数据,他们已经分好了类,把这一堆数据看成一个一个的点,他们有坐标。现在来了一条测试数据(这条数据也相当于一个点,有坐标),让你对他进行分类,你怎么分呢? knn是这么做的,以这个测试数据为中心点画一个r=5(这个数你自己定)圆, 然后看这个圆圈里包含了哪些点,这些点里面,哪类最多,就把你分为哪类。原创 2017-08-07 16:18:07 · 247 阅读 · 0 评论 -
mac安装opencv
1.mac安装opencv 2.pyhton代码实现 3.anaconda切换环境 环境搞得真是蛋疼原创 2017-10-29 23:17:27 · 406 阅读 · 0 评论 -
机器学习入门
1.常用算法 决策树 随机森林算法 逻辑回归 SVM 朴素贝叶斯 Knn算法 K-means算法 Adaboost 算法 神经网络 马尔可夫 2.聚类和分类的区别 分类:比如有一堆数据,你已经事先对他们做好了分原创 2017-08-07 14:05:51 · 237 阅读 · 0 评论 -
高斯混合聚类
1原创 2017-09-11 14:50:57 · 319 阅读 · 0 评论 -
K-means算法
此算法用于聚类 给你一些数据,他们的属性已经被数字化,你这么对他们进行聚类呢? k-means是这么做的 其实只要一条数据是数字化的,就可以把他们看成一个点。我们把这些记录看成一个点群。 我们对一些事物进行分类,其实就是看他们距离的远近,正所谓物以类聚,人以群分嘛。 比如,我们想把他们聚成3类,我们可以随机的选三个不同点,然后把每个测试数据与这三个点求距离,这个测试数据与三个点中哪个距离最原创 2017-08-07 16:49:29 · 230 阅读 · 0 评论 -
tensorflow
1.安装原创 2017-09-07 15:51:21 · 203 阅读 · 0 评论 -
xgboost使用入门
1.xgboost安装for mac原创 2017-09-07 12:20:39 · 194 阅读 · 0 评论 -
随机森林入门笔记
参考 1.如果说决策树是一棵树,那么随机森林就是多棵决策树,随机森林的出现其实就是对决策树的补充和优化。 2.假如有一堆数据,原来是通过一个决策树来建立模型做分类,现在是把这堆数据再分成k个数据堆,建立k个决策树也就是k个模型,假如现在来了个测试数据,我让他在每个模型上都跑一遍得出k种结果,选择结果出现的频率比较高的结果作为最终结果。 3.不同的决策树,他们的不同点在什么地方?原创 2017-08-07 14:29:28 · 257 阅读 · 0 评论 -
决策树学习笔记
在我看来,决策树的作用只有一个,就是做分类。并且我觉得机器学习的功能就是聚类和分类。如果以后另有发现,我改。 参考 1.树的概念 2.过度拟合 所谓过度拟合,就是实验中通过这种决策树做分类效果很好,但是到实际生产中正确率就下降很多 3.纯度,就是说有一个属性可以直接把测试数据集分为两类,假如这两类在是p1和p2,如果p2和p1的差值越大,说明通过这个属性作为起始节点就越合理。 4.正太分原创 2017-08-07 14:03:13 · 237 阅读 · 0 评论 -
线性回归
是原创 2017-08-10 17:24:51 · 185 阅读 · 0 评论 -
最小二乘法
用于寻找拟合方程,最小二乘法原创 2017-08-10 17:30:48 · 331 阅读 · 0 评论 -
BP神经网络算法
参考 学了一个星期高数,我以一个初学者的身份来描述一下这个算法,希望我能讲的通俗易懂。 1、在学习这个算法之前,先看一下如何解决下面这个问题。 有一组点{(2,3,5),(4,5,7),(6,8,10)},如何确定一条直线能最大的拟合这些点? 我们把这个问题转换一下就是,确定一个函数表达式z=f(x,y)=ax+by,使用这个函数表达式求得的值与真实点z坐标的值相差的平方S, S=(2a+原创 2017-08-08 14:47:40 · 446 阅读 · 0 评论 -
特征工程(如何合理地把非数值特征转换成数值特征)
现在我理解的特征工程的意义是:如何把非数值特征转换成数值特征? 1、假如有一个属性是职业,有这三种职业,教师、公务员、工程师,现在要用一个基于线性回归的算法,来训练模型,假如f(x,y)=ax+by,a,b代表权重,x代表职业这个属性值,那么如何给这个x赋值?解决方案: 1、人工无脑的赋值,比如教师=1,公务员=2,工程师=3,但是这样科学吗?假设教师和工程师的特征比较相似,这样显然不合适。但是原创 2017-08-10 17:15:05 · 3574 阅读 · 0 评论 -
感知器学习算法
1.原创 2017-08-08 14:48:43 · 309 阅读 · 0 评论 -
sklearn入门
#导入保存模型工具包from sklearn.externals import joblib#导入操作系统包import os#定位到这个路径os.chdir("/Users/yeshuai/")#导入sklearn的svm算法from sklearn import svm#定义数据特征矩阵x = [[1,2,3], [2,3,4],[1,2,3], [2,3,4],[1,2,3原创 2017-08-21 13:38:21 · 277 阅读 · 0 评论