1.什么是无监督学习
无监督学习:训练数据中没有给出数据的标注信息,算法需要自动找出数据中的结构特征,将数据分为若干个簇(数量未知),常见的聚类算法就是无监督学习。
举例:
- 谷歌新闻(收集大量新闻并自动对其分簇,相同内容的新闻会被显示在一起)
- DNA检测(根据基因特征进行聚类)
其他领域的应用:
- 组织大型的计算机集群,将趋于协同工作的机器放在一起从而提高集群效率
- 社交网络的分析,判断哪些人属于同一个圈子,是否相互认识
- 市场细分,公司根据客户信息对客户进行聚类分析,划分到不同的细分市场
- 天文数据分析,星系行程理论
2. 鸡尾酒会问题(“鸡尾酒算法”):将麦克风叠加起来的音频进行分簇,去除被动接收到的杂音,区分出每个麦克风应该正确接收到的声音。
3. 介绍Octave和Matlab,使用Octave构建算法原型,再用其他语言来实现它。