机器学习的应用
我们可以利用计算机实现基础的功能:例如计算A到B的最短路径
但是 网页搜索、垃圾邮件的过滤、图片识别 等功能需要应用机器学习的技术,总体来说分成五个方面
- 1、数据挖掘,例如分析用户的点击量来分析用户习惯,医疗记录=> 医疗知识
- 2、对于某些无法直接编写代码的场景,例如手写识别
- 3、NLP 自然语言处理
- 4、私人订制的相关的特性,这个例如个人的习惯,往往需要应用机器学习的知识才可以构建用户画像
- 5、理解人的大脑
机器学习定义、类型
:定义
1、在没有明确设置情况下,使得计算机能够处理问题的方法
2、计算机程序从经验E中学习,解决某一个问题T,进行某一性能度量P,通过测量P在T上面表现因经验E而上升
:分类
1、监督学习,教计算机学
2、无监督学习,让计算机自己学
3、强化学习
4、推荐系统
课程的目标
学习各种机器学习的算法,并且给出应用机器学习时的实际建议,如何正确使用
监督学习
1、回归
指的是对于连续变量进行预测,变量一般是连续的,比如按照因变量与自变量的关系,进行曲线拟合,最后求自变量为某一给定值情况下因变量的值
2、分类
指的是对于离散变量进行预测,并且一般离散变量的类型都是有限个数的
- 监督学习,数据集中肯定给出了样本的答案,我们是通过算法,不断提高预测正确率,回归问题是对连续变量预测,分类问题是对离散变量进行预测
无监督学习
无监督学习,一般对应着聚类,例如谷歌新闻中,会进行板块的划分,一类信息会放在同一个主题模块下,这种就是聚类,应用情景
- 组织计算机集群工作
- 计算社交圈
- 市场分割
- 天文数据分析
分析
通过给出的一个聚类算法代码,启示是,许多机器学习算法,对应的实现代码还是很简洁的,特别是用octave/matlab等语言来实现的时候~