机器学习
秃头崽崽
这个作者很懒,什么都没留下…
展开
-
机器学习之手写数字图片数据处理及识别
目录标题背景实现过程简说图片预处理构建模型代码实现背景1.手写数字识别技术的含义手写数字识别(Handwritten Digit Recognition)是光学字符识别技术的一个分支,是模式识别学科的一个传统研究领域。主要研究如何利用电子计算机自动辨认手写在纸张上的阿拉伯数字。手写数字识别分为脱机手写数字识别和联机手写数字识别。本文主要讨论脱机手写数字的识别。 随着信息化的发展,手写数字识别...原创 2020-04-29 20:07:22 · 13117 阅读 · 6 评论 -
sklearn中混淆矩阵(confusion_matrix函数)的理解与使用
混淆矩阵百度百科的定义:混淆矩阵(confusionmatrix)也称误差矩阵,是表示精度评价的一种标准格式,用n行n列的矩阵形式来表示。具体评价指标有总体精度、制图精度、用户精度等,这些精度指标从不同的侧面反映了图像分类的精度。在人工智能中,混淆矩阵(confusionmatrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。在图像精度评价中,主要用于比较分类结果和...原创 2020-04-29 17:38:18 · 67836 阅读 · 16 评论 -
sklearn特征选择 保留特征名称
经过特征选择后,数据变成了array类型,并失去了特征名称,查询资料后没有找到直接保留特征名称的方法。但是有一个get_support函数,可以保留提取出来的特征索引。于是就通过这个方法自己加几句代码,取出特征选择后的特征名称。1.方差过滤from sklearn.feature_selection import VarianceThreshold # 方差过滤selector = Va...转载 2020-04-29 13:54:22 · 4617 阅读 · 3 评论 -
手写数字图片数据之python读取保存、二值化、灰度化图片+opencv处理图片的方法
python 读取、保存、二值化、灰度化图片+opencv处理图片的方法进行手写数字的图片预测的时候碰到了这样的问题。先说说处理图片有三种方式一、matplotlib二、PIL三、opencv一、matplotlib1、显示图片import matplotlib.pyplot as plt #plt 用于显示图片import matplotlib.image as mpimg #...原创 2020-04-28 13:35:30 · 2962 阅读 · 0 评论 -
机器学习——聚类分析相关知识
聚类分析概述分类与聚类分类:学习/训练过程有监督,训练样本有明确标签聚类:学习/训练过程无监督,样本无明确标签聚类的概念聚类是把各不相同的个体分割为有更多相似性子集合的工作。聚类生成的子集合称为簇聚类的要求生成的簇内部的任意两个对象之间具有较高的相似度属于不同簇的两个对象间具有较高的相异度聚类与分类的区别在于聚类不依赖于预先定义的类,没有预定义的类和样本——聚类是...原创 2020-03-31 11:30:40 · 2068 阅读 · 0 评论 -
机器学习——朴素贝叶斯算法相关笔记
计算公式缺陷:受样本个数限制,若某个属性值在训练集中没有与某个同类同时出现过,如P清脆|是=P (敲声=清脆|好瓜=是)=0/8=0,则连乘公式h (好瓜=是)则必为零,其他属性取任意值都不能改变这一结论。修正方法:拉普拉斯平滑处理算法处理过程原始的朴素贝叶斯只能处理离散数据,连续数据使用高斯朴素贝叶斯(Gaussian Naive Bayes)完成分类任务。当处理**...原创 2020-03-24 10:27:24 · 650 阅读 · 0 评论 -
机器学习--KNN算法的相关笔记
KNN算法(k-Nearest Neighbor Classification)---- k-近邻分类算法• 一个样本在特征空间中,总会有k个最相似(即特征空间中最邻近)的样本。其中,大多数样本属于某一个类别,则该样本也属于这个类别。• 是理论上比较成熟的方法,也是最简单的机器学习算法之一。行业应用:客户流失预测欺诈侦测等(更适合于稀有事件的分类问题)计算步骤:算距离:给定测试...原创 2020-03-24 10:03:25 · 380 阅读 · 0 评论