Supervised Learning 监督学习
我们给算法一个数据集,包括了正确答案。然后算法学习出能够给出更多的正确答案。
这也叫做回归问题。回归是指我们设法预测连续值的属性。
想起数学中的函数方程。
多项式方程,如何从多个因变量得到结果。
就是可以通过发现数据中的一些属性跟答案之间的关系,我们能够推出一个公式。
分类是指,我们设法预测一个离散值输出,可能有很多类型。
测试
-
你有很多同一件货物的库存,假设你有几千件相同的货物要卖。你想预测在接下来的三个月内你能卖出多少件?
-
第二个问题是,你有很多用户,你想要写一个软件来检查每一个客户的账户,对于每个客户的账户,判断这个账户是否被入侵或破坏。
请判断是回归问题还是分类问题。
很简单吧。。
Unsupervised Learning 无监督学习
给一个数据没有被告知结果,不知道每个数据点是什么,我们只是被告知这里有一个数据集,你能在其中找到某种结构吗?
对于给定的数据集,无监督学习可能判定该数据集包含不同的数据簇。
这就是聚类算法。
举个例子就是 。新闻主题。如何把大量的新闻自动归类并提取主题。
我们没有提前知道这个新闻主题的名字,这个新闻主题是我们给数据的。
社交网络的分析,如何分析同一个圈子的朋友。
市场分割和销售。星系形成理论。
音频处理一行代码:
[w,s,v] = svd((repmat(sum(x.*,1),size(x,1).*x)*x');
吴恩达 介绍了一个工具语言Octave。
总结
发现有些概念好像很简单的样子。
发现自己本来打算看的,一直拖着没看。。