问题:
- 如何从各种不同来源中构造算法所需要的数据??
- 如何实用两种不同的算法:
- 更多有关距离度量的知识
- 简单的图形可视化代码,用于观察所生成的群组
- 如何将异常复杂的数据投影到二维空间中
数据聚类
数据聚类,是一种用以寻找紧密相关的事、人或观点,并将其可视化的方法。聚类时常被用于数据量很大的应用中。跟踪消费者行为的零售商们,除了利用常规的消费者统计信息外,还可以利用这些信息自动检测出具有相似购买行为模式的消费者群体。年龄和收入都相仿的人也许会有迥然不同的着装风格,但是通过使用聚类算法,可以找到“时装岛”,并据此开发出相应的零售或市场策略。
监督学习和无监督学习
监督学习是利用样本输入和期望输出来学习如何预测的技术。我们