哔哩哔哩:《机器学习》(吴恩达)
目录
1-1 简介
机器学习从AI研究中诞生,对计算机而言是一种新的能力。可应用于数据挖掘领域,如:网站点击数据收集、医疗记录等;机器自主编写应用:如自然语言处理(NLP)和计算机视觉(CV)等; 定制化程序领域:个性化推送等。
1-2 定义
Arthur Samuel:在没有明确设置的情况下,使计算机具有学习能力的研究领域
Tom Mitchell:计算机程序从经验E中学习,解决某一任务T和某一性能度量P,通过P测定在T上的表现因经验E而提高。
1-3 监督学习
1.定义
给计算机一组包含正确答案的数据集,使其给出更多的正确答案。监督学习分为“回归”和“分类”问题两类。
2.回归问题
预测连续数值的输出
例如:根据房屋大小及其实际售价,预测某户型房价,以俄勒冈房屋价格预测为例,学习算法将根据数据画出拟合曲线,如直线、二次函数曲线等。
3.分类问题
预测离散值的输出
例如:根据病人年龄及肿瘤大小,预测肿瘤是恶性还是良性。以乳腺癌病例为例:
也可用不同符号表示良性或恶性肿瘤:
若已知病人肿瘤大小及其年龄,其肿瘤情况如下图:
学习算法会根据数据将两类情况进行区分。
1-4 无监督学习
1.定义
无监督学习使我们能够在几乎不知道结果应该是什么样子的情况下解决问题。
2.聚类算法
给计算机一组特征不同的数据,但并未定义其不同之处,由计算机自主将数据分为不同组。如谷歌 或百度搜索,能将不同新闻按照类型进行自动分类。
3.鸡尾酒会问题
仍是将不同类型或特征的数据分成不同组。