机器学习
文章平均质量分 91
cp0328
自由空间是各向同性的
展开
-
svm实现“学校教务在线验证码”的识别
本文利用机器学习的课程作业的机会,实现了一个识别学校教务在线的验证码的项目。本文将从每一步的实现具体说起一、收集验证码利用爬虫简单的爬取了学校教务在线的100条验证码。二、图片的预处理为了方便svm的识别分类,我们先将图片进行简单的灰度化处理。利用opencv将threshold的阈值选择到140。得到不错的显示结果。接下来,将图片进行裁剪,人工进行标签。从图片看出,每一个图片...原创 2019-10-22 12:38:01 · 919 阅读 · 0 评论 -
[机器学习笔记]降维(PCA)
本文主要将对降维所涉及到的概念知识点和推导思路进行简述,并附上具体的推导笔记,同时结合uci上的“鸢尾花分类”进行实战一、维度灾难现实应用中特征维度经常成千上万,要满足密采样所需的样本数目是个天文数字。另外许多学习方法都涉及距离计算,而高维空间会给距离计算带来很大的麻烦(高维空间中计算内积都麻烦)。因而,在高维情形下出现的数据样本稀疏、距离计算困难等问题是所有机器学习方法共同面临的严重障...原创 2019-10-14 10:29:30 · 832 阅读 · 2 评论 -
[机器学习笔记] 梯度下降法
Gradient Descent algorithmrepeat until convergence { θj=θj−α∂∂θjj(θ0,θ1)\theta_j=\theta_j-\alpha\frac{\partial}{\p...原创 2019-04-23 12:09:18 · 3103 阅读 · 0 评论 -
[机器学习笔记] 矩阵和向量
矩阵的运算1.Matrix Vector Multiplication(矩阵的乘法)[abcdzf]A∗[12]B=[a+2bc+2dz+2f]C\left[\begin{matrix} a & b\\ c & d\\ z & f \end{matrix} \right]_A* \left[\begin{matrix}...原创 2019-04-24 17:05:00 · 3424 阅读 · 0 评论 -
PCA应用(鸢尾花分类)
1.PCA1.1PCA的概念PCA(Principal Component Analysis),即主成分分析方法,是一种使用最广泛的数据降维算法。PCA的主要思想是将n维特征映射到k维上,这k维是全新的正交特征也被称为主成分,是在原有n维特征的基础上重新构造出来的k维特征。PCA的工作就是从原始的空间中顺序地找一组相互正交的坐标轴,新的坐标轴的选择与数据本身是密切相关的。其中,第一个新坐标轴...原创 2019-07-19 16:09:06 · 9307 阅读 · 2 评论 -
[机器学习笔记]k-means实战 (以wine数据集为例)
本博客将以wine数据集,一步一步的演示K-means实战的全过程,让大家学会和使用k-means方法进行聚类(本人也是初学伊始,大佬勿锤)1.数据集来源特征分别为:酒精 苹果酸 艾熙 灰分碱性 镁 总酚类 黄酮类 非淀粉酚类 原花青素 颜色强度 色调 稀释葡萄酒的OD280/OD315 脯氨酸数据来自uci,点击此处即可下载2.背景知识1.评价聚类的常用指标指标兰德指数(...原创 2019-09-19 23:12:35 · 24222 阅读 · 6 评论 -
[机器学习笔记]逻辑回归实战
机器学习的第三天,总结一下今天将的逻辑回归,一个名字叫回归的模型,却用来解决分类问题的模型1.数据集合老师提供的两个数据集,2.代码框架读取数据data = pd.read_csv("data1.data",header=None,index_col=False)columns = np.array(['a','b','category'])data.rename(col...原创 2019-09-25 15:43:11 · 547 阅读 · 0 评论 -
[机器学习笔记] svm公式推导和实战
本文主要将对svm所涉及到的概念知识点和推导思路进行简述,并附上具体的推导笔记,同时结合uci上的“乳腺癌数据”进行诊断分类的实战首先svm优缺点的官方解释如下:在高维空间较好在特征空间远远大于样本空间时,依然较好决策函数中只使用了训练数据集的子集(称为支持向量)。多功能:可以为决策功能指定不同的内核函数。提供了公共的内核,但是也可以指定定制的内核。缺点如下:如果特征个数远...原创 2019-10-07 21:56:01 · 719 阅读 · 5 评论