机器学习算法
thiefun2020
这个作者很懒,什么都没留下…
展开
-
机器学习01-KNN算法的python实现及手写体数字的识别
1.knn算法介绍:(copy自百度) 邻近算法,或者说K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。 kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。原创 2018-01-05 19:59:52 · 619 阅读 · 0 评论 -
机器学习02-使用python中的sklearn库进行数据的预处理(数据的特征工程)
1.数据预处理的意义: 机器学习是从数据中自动分析获得规律(模型),并利用规律对未知数据进行预测.由于数据在获取过程中难免出现异常值,缺失值,多条特征数据线形相关,或者特征数据不适用于算法需求等问题.数据和特征决定了机器学习的上限,数据预处理将原始数据转换为既能代表数据整体特征,又满足算法(模型)需求的数据集(将真实值转变为特征值),从而提高提高了对未知数据的模型准确性. 2.python实现原创 2018-01-16 22:57:25 · 829 阅读 · 0 评论