机器学习
文章平均质量分 88
风之谷回
这个作者很懒,什么都没留下…
展开
-
线性回归(最小二乘法)
线性回归(最小二乘法)定义:线性回归在假设特证满足线性关系,根据给定的训练数据训练一个模型,并用此模型进行预测。举例:我们假设一个线性方程 y=2x+1y=2x+1y=2x+1, x变量为商品的大小,yyy代表为销售量;当月份x=5x=5x =5时,我们就能根据线性模型预测出 销量为y=11y=11y =11;对于上面的简单的例子来说,我们可以粗略把 y=2x+1y=2x+1y=2x+1看...原创 2018-08-01 01:05:52 · 1870 阅读 · 1 评论 -
kMeans
kMeans是一种简单的聚类算法,是一种无监督学习算法聚类就是把同一类的数据聚在一起。意思是使同一类的数据相似度比较大,类别之间的数据相似度比较小。或者是距离。 聚类的基本思想: 以空间中k个点为形心进行聚类,对最靠近他们的对象归类。通过迭代的方法,逐次更新各簇的类中心的值,直至得到最好的聚类结果。算法如下: (1)选择k个初始类中心 (2)迭代: 1)把每个...原创 2018-08-01 01:34:10 · 548 阅读 · 0 评论 -
kNN
既是最简单的机器学习算法之一,也是基于实例的学习方法中最基本的,又是最好的文本分类算法之一。如对电影的分类,收集许多电影及特征如拥抱镜头,打斗镜头和搞笑镜头的数量,和label,构成了数据集。然后对一个新电影进行分类属于爱情片,动作片还是喜剧片。算法思想:一个样本与数据集中的k个样本最相似,如果这k个样本中的大多数属于某一个类别,则该样本也属于这个类别。那么问题是有一个新样本,问属于哪类?...原创 2018-08-01 01:07:44 · 329 阅读 · 0 评论 -
逻辑回归
逻辑回归已知:给定数据,包含数据的特征和label问题:二分类,根据数据的特征,对数据二分类。例子:给定一个肿瘤的特征,如大小形状等等,判断是否是恶性肿瘤。基础:线性回归,输入一个肿瘤各种特征,经过线性变换得到一个预测值y,若y>0.5为恶性,y<0.5为良性。大概原理:逻辑回归是在线性回归的基础上,增加了一个sigmoid函数。 为什么要增加这么一个函数呢?一...原创 2018-08-01 01:06:23 · 407 阅读 · 0 评论