机器学习
ly_不忘初心
这个作者很懒,什么都没留下…
展开
-
sklearn中的KNN算法实现鸢尾花分类
简介使用sklearn自带的鸢尾花数据集,通过kNN算法实现了对鸢尾花的分类。算法思路通过计算每个训练样例到待分类样品的距离,取和待分类样品距离最近的K个训练样例,K个样品中哪个类别的训练样例占多数,则待分类样品就属于哪个类别。核心思想如果一个样本在特征空间中的 k 个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据...原创 2019-10-17 14:53:35 · 5274 阅读 · 0 评论 -
windows10下安装graphviz的解决办法
最近学机器学习的决策树部分,使用sklearn.tree.export_graphviz()该函数导出DOT格式,但是无法查看dot后缀的文件,需要安装graphviz将dot文件转换为pdf、png格式,电脑是windows10的系统,网上大多都是linux和mac系统。为了以后方便学习,解决办法总结如下:1.从官网上下载包网址链接:https://graphviz.gitlab.io/_p...原创 2019-10-15 21:29:02 · 15816 阅读 · 5 评论 -
解决sklearn数据集20newsgroups()下载太慢的问题
问题描述:在我使用朴素贝叶斯算法对sklearn数据集fetch_20newsgroups()进行文本分类时,发现一直显示在下载,于是就搜了一下解决办法。总结如下:1.手动下载数据集下载链接:20Newsgroups/20news-bydate.tar.gz下载完成后修改文件名为:20newsbydate.tar.gz2.放在指定目录下放在:C:\User\登录名\scikit_lea...转载 2019-10-15 15:12:28 · 3486 阅读 · 0 评论