k近邻算法
文章平均质量分 74
菜地里翻滚的猪
It界的小鲁班
展开
-
机器学习实战--K近邻算法的实现(三)
使用K近邻算法识别手写数字这里构造的系统只能识别数字0-9,需要识别的数字已经使用图形处理软件处理成32*32大小的黑白图像,并将其转换为图像格式。实际图像存储在两个子目录中:目录trainingDigits中,大约包含2000个例子,每个数字大约有200个样本,同一个数字有多种书写形态,数字样本被命名为:数字...原创 2018-10-14 22:17:00 · 300 阅读 · 0 评论 -
机器学习实战--K近邻算法实现(一)
KNN算法的工作原理为:存在一个样本数据的集合,也称作训练样本集合,并且样本集的每个数据都存在标签。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似的分类标签,一般只选择样本集中前K个最相似的数据,前K个相似数据中出现次数最多的分类作为新数据的分类。创建knn.py的文件,在pycharm的命令行窗口切换到该文件所在的目录,输入Py...原创 2018-10-10 14:31:02 · 165 阅读 · 0 评论 -
机器学习实战--K近邻算法实现(二)
实例:使用K近邻算法改进约会网站从文本文件中解析数据数据样本存放在txt类型文件中,每个样本占一行,总共有1000行,每行样本都包含的特征为:每年获得的飞行常客里程数 玩视频游戏所耗时间百分比 每周消耗的冰淇淋公升数将上述特征输入到分类器之前,需要将待处理的数据格式设置为分类器可以接收的数据,为此创建file2matrx的函数,...原创 2018-10-10 15:33:51 · 149 阅读 · 0 评论