监督学习
监督学习中,对于数据集中的每个数据都有相应的正确答案(训练集),算法就是基于这些来做出预测。
1.回归问题:通过回归来预测一个连续值输出
例:
你有一堆货物的清单。 假设一些货物有几千件可卖, 你想预测出,你能在未来三个月卖出多少货物。
2.分类问题 :目标是预测离散值输出。
例:
你有很多用户, 你打算写程序来检查每个用户的帐目。 对每个用户的帐目, 判断这个帐目是否被攻击过。
无监督学习
它是一种学习机制,你给算法大量的数据,要求它找出数据中蕴含的类型结构,这就是无监督学习。
在无监督学习下,没有基于预测结果的反馈。
例:
市场细分:通过大量的市场数据细分不同用户类型市场。
新闻故事:从网络搜集大量新闻数据,将同样内容的新闻划分到一起。
视频中讲解了鸡尾酒会算法(https://en.wikipedia.org/wiki/Cocktail_party_effect)
[W,s,v]=svd((repmat(sum(x.*x,1),size(x,1),1).*x)*x');
//TODO 后面使用代码实现鸡尾酒会算法
吴教授推荐了开发工具octave:工程计算软件
windows下octave下载地址:https://ftp.gnu.org/gnu/octave/windows/