机器学习
wa1tzy
速战速决!
展开
-
Machine Learning——sklearn系列(八)——鸢尾花分类的逻辑回归实现
文章目录前言一、详解Numpy中的数组拼接、合并操作(concatenate, append, stack, hstack, vstack, r_, c_等)二、Python字符串格式化三、代码前言项目描述:根据鸢尾花的花萼长度与宽度的特征数据统计,对其进行逻辑回归分类。特征:花萼长度、花萼宽度类别标签:0 - 山鸢尾(setosa)1 - 杂色鸢尾(versicolor)2 - 维吉尼亚鸢尾(virginica)一、详解Numpy中的数组拼接、合并操作(concatenate, appen原创 2020-07-13 10:58:11 · 1582 阅读 · 0 评论 -
Machine Learning——sklearn系列(七)——降维
文章目录一、PCA(主成分分析)1.1 PCA主成分分析的矩阵原理-特征值与奇异值1.1.1 特征值1.1.2 奇异值1.1.31.2 PCA代码二、LDA2.1 代码一、PCA(主成分分析)主成分分析(PCA)实现一般有两种,一种是对于方阵用特征值分解去实现的,一种是对于不是方阵的用奇异值(SVD)分解去实现的。1.1 PCA主成分分析的矩阵原理-特征值与奇异值1.1.1 特征值特征值很好理解,特征值和特征向量代表了一个矩阵最鲜明的特征方向。多个特征值和特征向量的线性组合可以表示此矩阵。选取特征原创 2020-07-13 09:43:00 · 565 阅读 · 0 评论 -
Machine Learning——sklearn系列(六)——聚类算法(2)
文章目录五、DBSCAN(密度聚类)5.1 基础概念5.2 DBSCAN算法优缺点六、Affinity Propagation(AP聚类)6.1 算法描述6.2 AP算法选举例子理解:七、Gaussian Mixture model(高斯混合模型GMM)7.0 协方差与相关性7.1 高斯模型7.2 高斯混合模型7.2.1 EM算法八、谱聚类九、聚类衡量指标(无标签)9.1 轮廓系数9.2 CH分数9.3 戴维森堡丁指数(DBI)十、代码五、DBSCAN(密度聚类)5.1 基础概念作为最经典的密度聚类算原创 2020-07-10 17:18:15 · 770 阅读 · 0 评论 -
Machine Learning——sklearn系列(六)——聚类算法(1)
文章目录前言一、K-Means二、K-means++2.1 算法步骤2.2 K-means++例子2.3 效率三、MeanShift(均值迁移)3.1 概述3.2 图解过程3.3 算法函数四、层次聚类前言每种聚类方法在不同数据状况下表现的优劣图:代码实现import timeimport warningsimport numpy as npimport matplotlib as mplimport matplotlib.pyplot as pltfrom sklearn impor原创 2020-07-10 11:50:01 · 1145 阅读 · 0 评论 -
Machine Learning——sklearn系列(五)——集成学习
文章目录一、集成学习二、bagging2.1 基本描述一、集成学习多个小模型,通过最后的决策算法来决定最后的结果。集成方法常分为两类:(1)averging methods:平均法的原则是: 独立的构建几个学习器,然后平均他们的预测。通常,组合的学习器要比任何一个单个的学习器要好,因为它降低了方差。其中的代表:bagging 方法,随即森林(2)boosting methods:学习器依次构建(递进方法),试图降低组合的学习器的偏差。原创 2020-07-09 14:11:54 · 838 阅读 · 0 评论 -
Machine Learning——sklearn系列(四)——决策树与回归树
文章目录一、决策树二、决策树学习算法2.1 特征选择一、决策树决策树模型是运用于分类以及回归的一种树结构。决策树由节点和有向边组成,一般一棵决策树包含一个根节点、若干内部节点和若干叶节点。决策树的决策过程需要从决策树的根节点开始,待测数据与决策树中的特征节点进行比较,并按照比较结果选择选择下一比较分支,直到叶子节点作为最终的决策结果。内部节点:对应于一个属性测试叶节点:对应于决策结果根节点包含样本全集;每个节点包括的样本集合根据属性测试的结果被划分到子节点中;根节点到每个叶节点的路径对应对应原创 2020-07-08 13:33:29 · 1191 阅读 · 0 评论 -
Machine Learning——sklearn系列(三)——数据预处理
文章目录一、数据预处理二、标准化:去均值,方差规模化一、数据预处理1.首先要明确有多少特征,哪些是连续的,哪些是类别的。2.检查有没有缺失值,对确实的特征选择恰当方式进行弥补,使数据完整。3.对连续的数值型特征进行标准化,使得均值为0,方差为1。4.对类别型的特征进行one-hot编码。5.将需要转换成类别型数据的连续型数据进行二值化。6.为防止过拟合或者其他原因,选择是否要将数据进行正则化。7.在对数据进行初探之后发现效果不佳,可以尝试使用多项式方法,寻找非线性的关系。8.根据实际问题分原创 2020-07-07 23:46:31 · 409 阅读 · 0 评论 -
Machine Learning——sklearn系列(二)——分类
文章目录一、K近邻1.1 KD-TREE1.2 随机梯度下降法1.3 SVM二一、K近邻1.1 KD-TREEkd树(k-dimensional树的简称),是一种分割k维数据空间的数据结构,主要应用于多维空间关键数据的近邻查找(Nearest Neighbor)和近似最近邻查找(Approximate Nearest Neighbor)。其实KDTree就是二叉查找树(Binary Search Tree,BST)的变种。二叉查找树的性质如下:1)若它的左子树不为空,则左子树上所有结点的值均小原创 2020-07-07 23:34:27 · 368 阅读 · 0 评论 -
Machine Learning——sklearn系列(一)——回归
文章目录前言一、基础结构1.1 简单调参1.2 调参利器二、回归(可以理解为拟合)2.1 普通线性回归2.2 回归评估指标2.3 过拟合的问题2.4 岭回归2.4.1 岭系数对回归系数的影响2.5 LASSO回归2.6 弹性网络2.7 逻辑斯蒂回归(原始感知机)2.8 贝叶斯岭回归2.8.1 L1、L2正则化的由来与结论2.8.2 代码2.9 核岭回归2.10 SVR(支持向量回归)前言sciket-learn官网链接:https://scikit-learn.org/stable/sciket-le原创 2020-07-07 15:40:49 · 1100 阅读 · 0 评论 -
Machine Learning——CV系列(一)——Python+OpenCV应用实战——提取车牌号码
文章目录基于OpenCV的车牌提取项目基于OpenCV的车牌提取项目import cv2# 读取图片rawImage = cv2.imread("23.jpg")# 高斯模糊,将图片平滑化,去掉干扰的噪声image = cv2.GaussianBlur(rawImage, (3, 3), 1)# 图片灰度化image = cv2.cvtColor(image, cv2.COLOR_RGB2GRAY)# Sobel算子(X方向)Sobel_x = cv2.Sobel(image,原创 2020-07-06 14:32:19 · 467 阅读 · 1 评论 -
Machine Learning——CV系列(一)——Python+OpenCV核心操作(5)——特征提取与特征匹配
文章目录十、特征提取和特征匹配10.1 特征提取10.1.1 Harris角点检测10.1.2 Shi-Tomasi角点检测10.1.3 SIFT算法和SURF算法10.1.4 角点检测的FAST算法10.1.5 BRIEF算法10.1.6 ORB算法10.2 特征匹配10.2.1 BF算法10.2.2 FLANN匹配算法10.3 特征匹配和单应性查找对象十、特征提取和特征匹配10.1 特征提取特征提取指的是使用计算机提取图像信息,决定每个图像的点是否属于一个图像特征。特征提取的结果是把图像上的点分为原创 2020-07-06 00:00:46 · 797 阅读 · 0 评论 -
Machine Learning——CV系列(一)——Python+OpenCV核心操作(4)
文章目录五、图像金字塔5.1 高斯金字塔(低通)5.2 拉普拉斯金字塔5.3 图像金字塔用途六、模板匹配6.1 无缝融合(苹果与橘子融合的项目)七、图像直方图7.1 直方图均衡化7.2 自适应均衡化7.3 2D直方图7.4 直方图反向投影7.4.1 反向投影能做什么八、霍夫变换8.1 直线检测8.2 圆检测五、图像金字塔5.1 高斯金字塔(低通)高斯金字塔有两种形式:上采样和下采样。上采样是图片逐渐变大的过程;下采样是图片逐渐变小的过程。两种方式都会使图片越来越模糊。import cv2img原创 2020-07-05 23:27:18 · 337 阅读 · 0 评论 -
Machine Learning——CV系列(一)——Python+OpenCV核心操作(3)——边缘与轮廓
文章目录四、边缘与轮廓4.1 图像梯度(见梯度算子)4.2 Canny边缘提取算法4.2.1 原理与流程4.2.2 非极大值抑制4.2.3 双阈值边缘连接处理4.2.4 代码4.3 轮廓4.3.0 轮廓与边缘区别4.3.1 轮廓查找与绘制4.3.2 面积、周长和重心4.3.3 轮廓近似4.3.4 凸包和凸性检测4.3.5 边界检测4.3.5.1 方向性判断4.3.6 轮廓性质4.3.6.1 边界矩形的宽高比4.3.6.2 轮廓面积与边界矩形面积的比4.3.6.3 轮廓面积与凸包面积的比4.3.6.4 与轮廓原创 2020-07-05 22:35:17 · 1483 阅读 · 0 评论 -
Machine Learning——CV系列(一)——Python+OpenCV核心操作(2)——图像滤波
文章目录三、图像滤波3.1 滤波的概念3.2 卷积操作3.3 时域滤波3.3.0 时域滤波总结3.3.1 平滑算子(低通)3.3.1.1 均值滤波3.3.1.2 高斯滤波3.3.1.3 中值滤波3.3.1.4 双边滤波3.3.2 锐化算子(高通)3.3.2.1 Laplacian滤波3.3.2.2 USM锐化3.4 频域滤波3.4.1 傅里叶变换3.5 梯度算子(高通)3.5.1 Sobel 算子3.5.2 Scharr 滤波器3.5.3 Laplacian算子(拉普拉斯算子)三、图像滤波3.1 滤波的原创 2020-07-05 20:47:56 · 258 阅读 · 0 评论 -
Machine Learning——CV系列(一)——Python+OpenCV核心操作(1)
文章目录一、基本操作1.1 OpenCV读取、写入和保存图像1.2 色彩空间的转换1.3 基本图形绘制1.4 阈值操作1.4.1 OTSU二值化1.4.2 自适应阈值二值化1.5 图像上的运算1.5.1 图像混合1.5.2 按位运算1.6 图像的几何变换1.6.1 仿射变换(理解为图像里的线性操作)1.6.2 透视变换二、图像形态学操作2.1 膨胀和腐蚀2.2 五个基本算法一、基本操作1.1 OpenCV读取、写入和保存图像读取/保存存储空间:w*h*c*p(p是位宽)位宽:一个数据在内存占多少原创 2020-07-05 17:59:29 · 518 阅读 · 3 评论