本系列目的在于总结每一个分类器的特点(优点、缺点、使用数据类型、使用时的注意事项等)。相关代码自己搜。
python:建议使用2.7
python常用函数库:NumPy、scikit-learn等
python集成环境:anaconda
毕业季,玩了20天。
优点:
1、编程容易实现。
缺点:
1、局部最小值,大量数据收敛慢。
使用数据类型:
1、数值型
使用时注意事项:
0、没什么好讲。有个二分K-mean,就是划分一个簇为两个簇,是所有点距中心距离的平方差和最小。不过也没用(貌似通过相似度聚类的方法都不是很好;还有一种类似于topic model的产生概率模型聚类法<generative probability model clustering>,相对来说比较好用,详情参考coursera上的text analysis课程)。