0.机器学习定义
一个程序由经验E中学习,解决任务T,达到性能度量值P,当且仅当,有了经验值E后,经过P的评判,程序在处理T的时候经验有所提升。
1.机器学习运用领域:
数据挖掘
无法手动编写的程序:NLP(自然语言处理),计算机视觉
私人订制程序:eg推荐
Understanding human learning (brain, real AI)
2.算法
(1)监督学习:我们会教计算机做某事
监督学习指的就是我们给算法一个数据集。这个数据集由特征值与正确答案组成。也就是说数据集是带标签的。
例如 (房子面积、楼层位置、价格)
(2)非监督学习:计算机自己学习
无监督学习中没有任何的标签,需要计算机自动探索数据的结构与规律。
Others: 强化学习,推荐系统
3.监督学习
案例:房价预测、垃圾邮件分类、糖尿病预测
回归问题:Regression 预测连续值的输出
分类问题:Classification 设法预测一个离散值输出0或1(有时也有2个以上可能的输出值)
可有多个属性
4.无监督学习
聚类算法 eg:google新闻分类
应用:(1)组织大型的计算机群 (2)社交网络分析 (3)市场细分 (4)天文数据分析 (5) 基因表达
code案例:(音频分离代码)【W,s,v】=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');