python
冻鸡hhhh
python小白的进阶之路
展开
-
Python第三方库的安装及测试
Python是一种面向对象,直译式计算机程序设计语言,也是一种功能强大而完善的通用型语言,其具有脚本语言中最丰富和强大的类库,足以支持绝大多数日常应用。那如何将第三方库安装到Python中呢? 接下来将告诉大家如何实现第三方库的安装。1 第三库的安装 【第三方库下载地址 1.1 Python的版本确定 在网站中,我们可以看到在一个库中有好几个可供下载的文件,哪究竟该下哪一个呢?这些是需要根据原创 2017-07-18 22:10:50 · 5430 阅读 · 1 评论 -
python中从外部读入数据并进行相应转换
在机器学习过程中,离不开大量的数据的训练和测试,而第三方库中所携带的数据库数量又是有限,当我们需要使用自己的数据时,如何将数据从外部读入,并将其转化为训练数据和测试数据?本文将介绍一种数据读入及转化方式,本文以csv格式的文件为数据集作为例子进行读取测试。iris.csv数据集 (ps,若数据集需要积分,百度云链接)首先看看iris.csv数据集长什么样子 其为150*4的数据集,共150个样本原创 2017-08-07 21:15:19 · 2998 阅读 · 0 评论 -
Python中枚举的使用
本文转自(http://www.cnblogs.com/ucos/p/5896861.html)1.枚举的定义 1.首先枚举要导入enum模块,实现代码:from Enum import enum 2.枚举定义用class关键字,继承Enum类 3.用于定义枚举的class和定义类的class是有区别代码示例:from Enum import enumclass Color (Enum):转载 2017-07-25 10:43:43 · 14345 阅读 · 1 评论 -
Python的numpy库中rand(),randn(),randint(),random_integers()等random系函数的使用
在使用Python进行数据处理时,往往需要用到大量的随机数据,那如何构造这么多数据呢?Python的第三方库numpy库中提供了random函数来实现这个功能。 本文将根据官方文档以及其他博友的博客一起来谈论常见的random函数以及使用 官方文档首先说下numpy.random.seed()与numpy.random.RandomState()这两个在数据处理中比较常用的函数,两者实现的作用是原创 2017-07-19 09:43:07 · 151498 阅读 · 9 评论 -
python中数据集划分函数StratifiedShuffleSplit的使用
文章开始先讲下交叉验证,这个概念同样适用于这个划分函数1.交叉验证(Cross-validation) 交叉验证是指在给定的建模样本中,拿出其中的大部分样本进行模型训练,生成模型,留小部分样本用刚建立的模型进行预测,并求这小部分样本的预测误差,记录它们的平方加和。这个过程一直进行,直到所有的样本都被预测了一次而且仅被预测一次,比较每组的预测误差,选取误差最小的那一组作为训练模型。下图所示2.Str原创 2017-07-27 12:18:37 · 41192 阅读 · 9 评论 -
python机器学习之支持向量机
本文是基于python第三方库sklearn官方文档 官方文档首先关于SVM的概念以及大体了解可以参考此篇博文,这里推荐给大家,作者写的很详细,很透彻 。支持向量机通俗导论1.SVM SVM英文全称Support Vector Mechine,叫做支持向量机,是一种有监督学习方法,可用于分类,回归,及outlier的检测SVM的核心即是核函数,核函数是计算两个向量在隐式映射后的空间中的内积函数将原创 2017-08-03 16:34:02 · 1075 阅读 · 0 评论 -
混淆矩阵及confusion_matrix函数的使用
关于混淆矩阵的概念,可参考此篇博文混淆矩阵1.混淆矩阵 混淆矩阵是机器学习中总结分类模型预测结果的情形分析表,以矩阵形式将数据集中的记录按照真实的类别与分类模型作出的分类判断两个标准进行汇总。这个名字来源于它可以非常容易的表明多个类别是否有混淆(也就是一个class被预测成另一个class)下图是混淆矩阵的一个例子 其中灰色部分是真实分类和预测分类结果相一致的,绿色部分是真实分类和预测分类不一致原创 2017-08-15 19:36:38 · 94682 阅读 · 5 评论