自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

SanyiRouROU的博客

肯勤奋学习的技术小白! 哈哈哈,我不会就这样了吧!

  • 博客(11)
  • 收藏
  • 关注

原创 数据集的导入及缺失值处理

怎么选择数据集?推荐阅读:机器学习可使用的数据集介绍UCI iris数据集本次实验所用的鸢尾花 iris数据集是来自于UCI Machine Learning Repository,比较简单,总共150行5列,前四列为特征向量,第五列为标签(0:Iris-setosa,1:Iris-versicolor,2:Iris-virginica),这三类各50行。观察所下载的 i...

2019-04-12 14:23:54 4029 1

原创 机器学习可使用的数据集介绍

我们在学习机器学习算法时候经常需要使用到一些现成的数据集来进行实验,便于我们更好地理解算法效果。数据集(Dataset)是一种由数据所组成的集合,每一列代表一个特定变量,每一行对应于该问题的某一成员,通常以表格形式(***.csv)出现。在选择数据集时要记住几个重要标准:数据集不能是混乱的,数据越干净越好,因为清理大型数据集会非常耗时 数据集不应该有过多的行或者列,便于处理...

2019-04-12 11:11:58 2162

原创 sklearn学习笔记 半监督分类 之 标签传播对手写数字分类

手写数字数据集总共有1797个点,但只有30个将被标记。 混淆矩阵形式的结果和每个类的一系列指标将非常好。标签传播模型将使用所有点进行训练,通过极少数标签对手写数字进行分类。本次实验主要是简单展示下“半监督学习”的强大功能:import numpy as npimport matplotlib.pyplot as pltfrom scipy import statsfrom s...

2019-04-14 21:36:45 1976 1

原创 sklearn学习笔记 半监督分类 之 标签传播与SVM的决策边界

“模式识别”研究的问题是如何将不同的事物划分为不同的类别,基于现有的研究,分类识别方法可分为三类:监督识别、非监督识别、半监督识别。1、监督识别需要事先给样本数据集做标签来训练分类器,前期标签数据费时费力;2、非监督识别可根据没有做好标签的样本数据自动生成分类器;3、半监督识别介于监督识别和非监督识别,给一部分样本数据做标签,另一部分不做标签,以此来增强分类器的性能。...

2019-04-14 20:41:10 2029

原创 sklearn学习笔记SVM 之 自定义Kernel

推荐阅读:功能强大的Python包sklearn概述机器学习可使用的数据集介绍数据集的导入及缺失值处理本次实验主要是自定义一个内核 Kernel 函数,然后使用sklearn.datasets 自带的鸢尾花Iris 数据集样本进行SVM 分类。import numpy as npimport pandas as pdimport matplotlib as...

2019-04-14 17:19:29 2353

原创 sklearn学习笔记SVM 之 分离超平面的最大边距

推荐阅读:机器学习可使用的数据集介绍数据集的导入及缺失值处理功能强大的Python包sklearn概述使用具有线性内核的支持向量机分类器绘制在两类可分离数据集中分离超平面的最大边距:import numpy as npimport matplotlib.pyplot as pltfrom sklearn import svm # sklearn 自带 SVM ...

2019-04-14 16:02:54 1861

原创 sklearn学习笔记SVM 之 非线性SVM

推荐阅读:机器学习可使用的数据集介绍数据集的导入及缺失值处理功能强大的Python包sklearn概述使用具有 RBF 内核的非线性 SVC 进行分类, 要预测的目标为数据集的标签 target。本次实验所用的数据选用 sklearn.datasets 自带的鸢尾花Iris 数据集:import numpy as npimport matplotlib.pypl...

2019-04-14 11:22:58 2640

原创 Jupyter Notebook使用小技巧

推荐阅读:Anaconda软件概述Anaconda下的Jupyter NoteBook安装及使用在主界面里可新建:Text File文本文件、Folder文件夹、Terminal终端及Python 3文件新建文件点击主菜单栏中“ Running ”,可以看到目前正在运行的文件有哪些,并可以在此彻底的关闭它:运行后台Jupyter Noteboo...

2019-04-13 12:18:08 711

原创 sklearn学习笔记SVM 之 鸢尾花二特征分类

推荐阅读:功能强大的Python包sklearn概述机器学习可使用的数据集介绍数据集的导入及缺失值处理用 sklearn.datasets 自带的Iris 数据集做个简单的小实验,鸢尾花 SVM 二特征分类:import numpy as npimport pandas as pdimport matplotlib as mplimport matplotlib....

2019-04-13 10:42:47 5044

原创 好用的文本编辑器推荐

Sublime Text 是什么?Sublime Text 是一个跨平台且具有漂亮用户界面和强大功能的文本编辑器,支持Windows、MacOS、Linux等操作系统。主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。功能特性:1、支持多种编程语言的语法高亮、拥有优秀的代码自动完成功能,还拥有代码片段功能,可...

2019-04-12 21:13:22 5610

原创 功能强大的Python包sklearn概述

在机器学习和数据挖掘的应用中,scikit-learn 是一个功能强大的 Python 包,内置了很多机器学习模块,也提供一些实验数据集。特点:简单有效的数据挖掘和数据分析工具 可供所有人访问,并可在各种环境中重复使用 基于 NumPy、SciPy 和 matplotlib 构建 开源,可用于商业- BSD许可证sklearn可用于分类(classification...

2019-04-12 10:15:55 830

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除