一、What is Machine Learning(18 min)
-
从普通人的学习到机器学习:让机器像人类一样,通过观察大量的资料,发现事物规律,获得某种分析问题、解决问题的能力。
从大脑到电脑CPU。
-
什么是技巧
机器学习的过程是从资料出发,然后经过这个电脑的计算之后最终得到某一种表现的增进。
学习投资理财
-
Tree Recognition
- 定义树木
- 从数据学习
- 观察树
- The Machine Learning Route
- 人不能系统地去做决定:导航
- 人类不好去辨识解决方法:视觉演说识别
- 需要很快做出决定:高频交易
- 人个性化使用:客户目标市场(推荐系统)
- 机器学习的三个关键因素
- 事物本身存在某种潜在规律(比如股市很乱,但是存在某种潜在规则)
- 某些问题难以使用普通编程解决(有这种规则,但是很那去写下来)
- 有大量的数据样本可供使用
- 习题1 选第三个
1.没有规则可以预测
2.很容易写成程式
4.没有数据
二、Applications of Machine Learning(18min)
- 衣食住行-机器学习改变·生活(逸仙君)
- 食物:通过twitter的数据来告诉餐厅食物是否有毒
- 衣服:售卖和用户调研,给出好的时尚搭配衣服
- 住房:房屋数据和能源消耗,预测房屋耗能
- 出行:交通标志图像和意义,识别交通准确性
- 育、乐(凯申公)
- 教育:学生数学测验分数,预测学生在考试中能答对多少题
ML solution:从大量数据知道学生程度和题目难度
上面这一个题目在kaggle上有比赛,是9m大小的资料。 - 娱乐:用户对电影评分(推荐系统),预测用户的喜爱电影
Netflix,Yahoo —— KDDcup
ML solution:对其中的一些特征用数字表示,可以把我们的特征和电影特征做内积。KDDcup yahoo
习题2 选择4
三、Components of Machine Learning(11min)
场景应用:银行该给哪些客户发信用卡。
学习问题的形式符号
输入:
x
∈
X
x \in \mathcal{X}
x∈X
输出:
y
∈
Y
y \in \mathcal{Y}
y∈Y
未知模式
⇔
\Leftrightarrow
⇔学习目标函数:
f
:
X
→
Y
f:\mathcal{X} \rightarrow \mathcal{Y}
f:X→Y
数据
⇔
\Leftrightarrow
⇔训练样本:
D
=
{
(
x
1
,
y
1
)
,
(
x
2
,
y
2
)
,
.
.
.
,
(
x
N
.
y
N
)
}
\mathcal{D} = \{{(x_1,y_1),(x_2,y_2),...,(x_N.y_N)}\}
D={(x1,y1),(x2,y2),...,(xN.yN)}
假设
⇔
\Leftrightarrow
⇔技巧:
g
:
X
⇔
Y
g:\mathcal{X}\Leftrightarrow\mathcal{Y}
g:X⇔Y
理想公式产生了资料,喂给机器学习演算法,最后得到我们的g,这里我们希望g能接近f。
我们目标的函数f是未知的,希望g能接近f。
机器学习从资料出发,我们要通过机器学习的演算法,算出假说g,最后拟合到h。
习题3 选择2
四、Machine Learning and Other Fields
Data Mining(资料挖矿)中:数据挖掘
- 主要应用于大量数据
- ML=DL 在KDDCup中
- DM能帮助ML,同样ML能帮助DM
- 传统上,DM关注高效处理大量数据
Artifitial Intelligence(人工智慧)中:人工智能 - ML能实现AI
- 机器从数据学习
Statistics(统计) - 实现ML的一种方法
- 传统统计用于数学
习题4 选择3
延伸阅读
預備知識
作業零 (機率統計、線性代數、微分之基本知識)
參考書籍
Learning from Data: A Short Course , Abu-Mostafa, Magdon-Ismail, Lin, 2013.
hw0:
参考
台湾大学林轩田机器学习基石课程学习笔记1 – The Learning Problem
latex参考:LaTex中插入花体字母
MathJax 支持的 Latex 符号总结(各种箭头符号)