![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
python机器学习
swt0711
这个作者很懒,什么都没留下…
展开
-
《机器学习实战》——K近邻算法Python实现问题记录(1)
《机器学习实战》第二章KNN算法,Python实现过程中出现的问题及解决方案记录(1) 最终运行代码: import operator import numpy as np import pandas as pd import os os.getcwd() import KNN as knn group,labels=knn.createDataSet() knn.classify0([0...原创 2018-07-17 10:33:43 · 902 阅读 · 0 评论 -
《机器学习实战》——K近邻算法Python实现问题记录 (2)文本解析
使用K邻近算法改进约会网站配对效果——文本文件解析到numpy,问题及解决记录 def file2matrix(filename): #打开文件并得到文件行数 fr = open(filename) arrayOLines = fr.readlines() # 一次读取整个文件,自动将文件内容分析成一个行的列表 numberOfLi...原创 2018-07-17 11:58:10 · 500 阅读 · 0 评论 -
《机器学习实战》——决策树之关于熵的理解及python实现
《机器学习实战》第三章决策树提到信息增益和熵的含义,并含python代码实现,本文对代码进行了注释。 一、熵的理解: 信息论创始人克劳德·艾尔伍德·香农,引入了信息熵,表示随机变量不确定度的度量。 公式如下: 满足如下三条性质: 单调性:发生概率越高的事件,所携带的信息熵越低。例:“太阳每天从东方升起”为确定事件,不携带信息,从信息论角度,没有消除任何不确定性,信息量为0。 非负性...原创 2018-07-17 18:08:20 · 627 阅读 · 0 评论