机器学习常用算法总结

最新推荐文章于 2021-01-12 13:38:05 发布

Bordery

最新推荐文章于 2021-01-12 13:38:05 发布

阅读量713

点赞数

分类专栏：机器学习文章标签：机器学习算法监督学习无监督学习半监督学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BertDai/article/details/76259979

版权

机器学习专栏收录该内容

10 篇文章 2 订阅

订阅专栏

本文主要归纳了一下最近看的关于机器学习的一些资料，算是一个survey，主要关注常用算法，不讲细节，就是一个概述。具体的算法描述我给了几个链接，大家可以参考里面的。

首先，如果从训练方法（主要针对有无lable）上对机器学习算法进行分类，可以分成三大类：监督学习，无监督学习和半监督学习。本文就按照这个分类进行讲解。其实还有一种比较流行的划分方式：监督学习，无监督学习和增强学习（RL）。RL在这里面确实是足以开山立派了，本文暂时不做讨论，博主这几天正好在学习RL，等着后面会发一个小系列的。

监督学习：

依赖于有标签的数据进行训练的算法，或者说，训练集采用有输入有输出的一组数据进行训练的算法。应用于分类和回归问题，常见算法有以下几种：

K临近算法（KNN）
决策树（Decision Trees）
朴素贝叶斯（Native Bayesian）
逻辑回归（Logistic Regression）
神经网络（NN）

具体的细节介绍给大家一个链接，里面写的比较详细：http://m.blog.csdn.net/laobai1015/article/details/75006511

当然，除此之外还有著名的Adaboost等算法。他们的优劣特性均不相同，下面这张表可以供大家参考：

无监督学习：

但在实际应用中，标签的获取常常需要极大的人工工作量，有时甚至非常困难。例如在自然语言处理中，Penn Chinese Treebank在2年里只完成了4000句话的标签。所以，无监督学习应运而生，它的训练集只需要有输入无输出的数据即可，常应用于聚类和降维的问题。常见算法有：

K-means
稀疏自编码(Sparse Auto-encoder)
高斯混合模型（Mixture ofGaussians）

算法的详细介绍参考：

http://www.cnblogs.com/xuesong/p/4179459.html

http://www.cnblogs.com/cherler/p/3604720.html

其中，K-means与KNN有很多相似之处，下表进行了详细对比：

可参考：http://www.cnblogs.com/nucdy/p/6349172.html

当然，从目前的学术阶段来看，监督学习的结果都还不错，但无监督学习的准确率仍然有待提高。

半监督学习：

这是一个跟无监督学习相比更新的方向，即采用了少量有有标签的数据作为辅助，同时还有大量无标签的数据一起训练。半监督学习现在主要的方法有三种：

Transductive SVM
协同训练（Co-training）
图的标签传播算法：（LabelPropagation）

具体的算法描述可以参考：http://f.dataguru.cn/thread-847067-1-1.html

半监督学习目前还没有像监督学习和无监督学习那样广泛使用，大多数文献资料都是各个研究员们在论文中提出的方法，认知度并不广。这方面的基本内容可以直接参考wiki：https://en.wikipedia.org/wiki/Semi-supervised_learning

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。