- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 svm实现“学校教务在线验证码”的识别
本文利用机器学习的课程作业的机会,实现了一个识别学校教务在线的验证码的项目。本文将从每一步的实现具体说起一、收集验证码利用爬虫简单的爬取了学校教务在线的100条验证码。二、图片的预处理为了方便svm的识别分类,我们先将图片进行简单的灰度化处理。利用opencv将threshold的阈值选择到140。得到不错的显示结果。接下来,将图片进行裁剪,人工进行标签。从图片看出,每一个图片...
2019-10-22 12:38:01 917
原创 [机器学习笔记]降维(PCA)
本文主要将对降维所涉及到的概念知识点和推导思路进行简述,并附上具体的推导笔记,同时结合uci上的“鸢尾花分类”进行实战一、维度灾难现实应用中特征维度经常成千上万,要满足密采样所需的样本数目是个天文数字。另外许多学习方法都涉及距离计算,而高维空间会给距离计算带来很大的麻烦(高维空间中计算内积都麻烦)。因而,在高维情形下出现的数据样本稀疏、距离计算困难等问题是所有机器学习方法共同面临的严重障...
2019-10-14 10:29:30 829 2
原创 [机器学习笔记] svm公式推导和实战
本文主要将对svm所涉及到的概念知识点和推导思路进行简述,并附上具体的推导笔记,同时结合uci上的“乳腺癌数据”进行诊断分类的实战首先svm优缺点的官方解释如下:在高维空间较好在特征空间远远大于样本空间时,依然较好决策函数中只使用了训练数据集的子集(称为支持向量)。多功能:可以为决策功能指定不同的内核函数。提供了公共的内核,但是也可以指定定制的内核。缺点如下:如果特征个数远...
2019-10-07 21:56:01 719 5
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人