分类算法
姬小野
这个作者很懒,什么都没留下…
展开
-
Python实现简单分类器
文章目录@[toc]第一步,导入我们需要的python库第二步,获取训练数据并解析坐标第三步,随机化数据第四步、生成分界线斜率第五步、处理测试数据第六步、输出展示分类结果输入数据完整代码今天重新开始学习机器学习,训练了一个简单的分类器。如何工作的呢?给定一组训练数据,他们的参数有三个,x轴坐标,y轴坐标,类别。即(x, y, c)。如图所示红色的圆点代表第一类点,类别编号为1;蓝色的倒三角...原创 2018-09-21 23:57:01 · 17349 阅读 · 1 评论 -
Scikit-Learn的评估器API学习-线性分类器
Scikit-Learn的评估器API遵照以下设计原则:统一性内省限制对象层级函数组合明智的默认值使用Scikit-Learn评估器API训练模型的常用步骤:一. 通过从Scikit-Learn中导入适当的模型评估器, 选择模型类如从线性模型中选择线性回归模型from sklearn.linear_model import LinearRegressionps. sk...原创 2018-11-17 12:24:10 · 351 阅读 · 0 评论 -
高斯朴素贝叶斯方法进行鸢尾花分类
贝叶斯方法完整代码import seaborn as snsiris = sns.load_dataset('iris')X_iris = iris.drop('species', axis=1)y_iris = iris['species']print(X_iris)from sklearn.cross_validation import train_test_splitXtr...原创 2018-11-17 16:36:56 · 9423 阅读 · 0 评论 -
无监督式学习-鸢尾花数据降维and聚类
一. 使用PCA(主成分分析)进行降维实现数据可视化降维的任务是要找到一个可以保留数据本质特征的低维矩阵来表示高维数据, 通常用于辅助数据可视化的工作.下面我们使用主成分分析(principal component analysis, PCA)方法, 这是一种快速线性降维技术. 模型返回两个主成分, 用二维数据表示鸢尾花的4维数据.1. 首先导入数据import seaborn as sn...原创 2018-11-17 17:29:28 · 2054 阅读 · 0 评论 -
K近邻算法-KNN-python简单实现
KNN算法是一种简单的机器学习算法,从大致原理上来理解相对简单。主要思路就是计算要分类的测试特征向量与训练数据集的特征向量的距离,计算距离的方法可以有很多种(如欧氏距离,海明距离),选取与其距离最小的k个特征向量,然后分析这k个向量所属的类别,其中,数量最多的类别可是做测试数据的类别。因此KNN可用于简单分类。K值得选择会对K近邻算法的结果产生重大影响。k近邻法没有显式的学习过程。没有训练算...原创 2019-02-24 21:38:33 · 423 阅读 · 0 评论 -
给代码分类-朴素贝叶斯
今天闲来无事,就用朴素贝叶斯算法写了一代码分类的程序,用来分辨是C++代码还是Python代码。传统方法其实用传统的特征字符串方法可以很轻松地做到(在常规环境下),毕竟python很少会有#include、iostream、namespace、cout、cin等词,而C++很少会有import、from、def、list、numpy等词,所以在普通的环境下是很容易识别成功的。def cla...原创 2019-05-14 23:57:09 · 514 阅读 · 0 评论