![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据分析
Data and Algorithms
这个作者很懒,什么都没留下…
展开
-
Python、sklearn、KNN分类算法学习——以鸢尾花数据分类为例
KNN分类算法学习——以鸢尾花分类为例KNN算法也叫k-近邻算法,是一种常用的分类算法。其分类原理为:如果一个样本在特征空间中的k个最相似的样本数据某一个类别,那该样本也属于这个类别。KNN算法核心思想:用你的“邻居”来推断你的类别关键点:该算法的核心是k值的选择。如果k值太少,容易受到异常值的影响;如果k值太大,容易受到样本不均衡影响。本案例使用Python作为编程语言,鸢尾花的数据从sklearn中导出,主要有以下步骤:获取数据数据处理 :数据集划分特征工程 :标准化(特征少,不需要降维原创 2020-05-14 22:02:23 · 1814 阅读 · 0 评论 -
numpy平均值插补步骤及详细说明
numpy平均值插法步骤及详细说明1.导入numpy工具并读取数据2.定义平均值插补函数3.调用平均值插补函数4.插补结果利用numpy对数据进行插补是一个非常常见的方法,代码也很多。但是网上的代码一般没有很详细的解释,不利于初学者学习。本帖就是在源代码的基础上添加了相关注释,便于初学者理解。1.导入numpy工具并读取数据在文件的同级目录下,建一个名为textdata.txt的数据,然后导...原创 2020-04-26 00:39:05 · 3034 阅读 · 0 评论