![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
K-近邻算法
文章平均质量分 85
PyRookie
这个作者很懒,什么都没留下…
展开
-
Python高级--逻辑回归、KNN回归比较
逻辑斯蒂回归、sklean自带数字图片load_digits()、产生数据集make_blobs坐标扁平化、取画布上的所有点、指定散点图点的颜色原创 2018-08-18 15:00:42 · 5662 阅读 · 0 评论 -
Python高级--K-近邻算法(KNN)
K nearest neighbour K-近邻算法采用测量不同特征值之间的距离方法进行分类。 优点:精度高、对异常值不敏感、无数据输入假定。 缺点:时间复杂度高、空间复杂度高。 适用数据范围:数值型和标称型。一、K-近邻算法(KNN)举例1)工作原理存在一个样本数据集合,也称作训练样本集,并且样本集中每个数据都存在标签,即我们知道样本集中每一数...原创 2018-08-16 09:32:52 · 1167 阅读 · 1 评论 -
ocr 光学字符识别(Optical Character Recognition)识别数字
识别分析: 图片是二维的数组 图片原始数据plt.imread('./digits/0/0_1.bmp')array([[255, 255, 255, 255], [255, 255, 255, 255]], dtype=uint8) 可以看出是一个二维数据, 但根据实际情况每行样本的列并不是样本的多个特征根据实际情况,每个图...原创 2018-08-16 11:00:29 · 1779 阅读 · 1 评论 -
K近邻值(KNN)小麦种类预测 预测年收入是否大于50K美元 癌症预测
知识点梳理:小麦种类预测: 打乱分离集和结果集,源码办法 年收入预测: 样本字符串转数字 癌症预测: 打乱分离集和结果集自带函数,样本数据归一化一、小麦种类预测1)处理数据1、导入数据samples = pd.read_table('./data/wheats.tsv',header=None)samplessamples.shape(210, 8...原创 2018-08-16 20:55:54 · 2824 阅读 · 3 评论 -
数据分析--时间问题与降维
数据降维降低预测时间使用自带的数字模型,查看使用KNN算法和逻辑回归算法的分类时间,并降低数据维度缩短预测时间一般处理速度问题的几个方面 1. 数据量太大 (抽样) 2. 样本特征太多 (降维) 3. 样本的量级太大(归一化) 4. 算法本身的问题 一、查看KNN与lgc(逻辑回归)处理分类问题的时间这里使用sklean自带的数据–图片数据类进行分类1)导包...原创 2018-08-22 21:31:06 · 2217 阅读 · 0 评论