![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python机器学习
文章平均质量分 76
Yakuho
网络爬虫、深度学习、古灵精怪的需求 :)
展开
-
【Python深度学习】基于Tensorflow2.0构建CNN模型尝试分类音乐类型(二)
前情提要基于上文所说 基于Tensorflow2.0构建CNN模型尝试分类音乐类型(一) 我用tf2.0和Python3.7复现了一个基于CNN做音乐分类器、用余弦相似度评估距离的一个音乐推荐模型。下面浅略介绍一下所用到的原理。一、总体架构二、实际原理首先使用8000个平均分布的8个流派的30s时长的mp3歌曲作为训练集。每一个流派含有1000首歌曲,使用python音频解析库librosa读取音频的采样率设置为44100,MFCC的n设置为128,再将生成的一张大声谱图分割成数个128×128原创 2021-01-14 00:10:42 · 1133 阅读 · 0 评论 -
【Python机器学习】基于KNN的简单通用应对字体反爬模型
解决字体反爬的简单通用模型技术点优点不足训练的代码示例以及步骤介绍预测的代码示例技术点自动获取字体坐标自动匹配不同大小的字体坐标矩阵使用相对坐标归一化来应对坐标处于坐标不同位置的情况直接产生键值对便于调用优点只需进行少量的数据标注工作就能建立字体映射模型直接写入需要解密的woff文件或ttf文件即可获得映射不足建立训练集的字体映射的时候可能会比较麻烦,不能做到自动化训练的代码示例以及步骤介绍训练步骤在dataset文件夹放入训练集文件.(woff / ttf)在代码原创 2020-08-11 18:02:10 · 277 阅读 · 0 评论 -
【机器学习】决策树原理以及代码实现
决策树(Decision Tree)什么是决策树信息论基础知识决策树Python代码什么是决策树决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy = 信息熵(系统的凌乱程度),使用算法ID3, C4.5和C5.原创 2020-07-16 11:39:34 · 341 阅读 · 0 评论 -
【机器学习】关联分析Apriori算法详解以及代码实现
Apriori算法以及统计学基础什么是关联分析简单的统计学基础Apriori输出频繁集从频繁项集中挖掘关联规则什么是关联分析从大规模数据集中寻找物品间的隐含关系被称作关联分析。而寻找物品的不同组合是一项十分耗时的任务,所需的计算代价很高。通过统计学方法,Apriori算法正可以解决这一问题。物品之间的关系一般可以有两种形式:频繁项集和关联规则。频繁项集:数据集中经常出现在一块的物品的集合。关联规则:两种物品之间可能存在很强的关系。下面借用一个在 《机器学习实战》第11章上的例子:交原创 2020-07-02 17:38:22 · 2278 阅读 · 0 评论 -
【机器学习】二分K-Means的原理以及代码实现
Bisecting K-Means什么是二分K-Means二分K-Means原理算法优缺点代码实现K-means博文点击此处什么是二分K-Means二分K-Means其实就是基于K-Means改进的算法,他的主要核心还是在于K-Means算法中,只不过它的算法思想是先从一个总簇,不断通过二分裂,直到分裂成k个簇则停止。在K-Means里博文当中,我们知道经过算法后,返回了2个参数:centroids:返回的是k质心的坐标矩阵clusterAssment返回的是m*2的簇矩阵,其中m是data原创 2020-06-29 18:20:47 · 1691 阅读 · 2 评论 -
【机器学习】K-means算法原理以及Python简单实现
K-均值聚类算法(K-means)什么是K-means算法原理算法优缺点代码实现什么是K-meansK-means是六大聚类算法中最简单的其中一种。而聚类是一种无监督学习,它将相似的对象归到同一个簇中。在介绍K-means之前,先介绍什么是簇识别。簇识别给出聚类结果的含义。假定有一些数据,现在将相似的数据归到一起,簇识别会告诉我们这些簇到底都是些什么。聚类与分类的最大不同在于,分类的目标事先已知,而聚类的目标没有预先定义的,所以聚类有时也被称为无监督分类。聚类分析试图将相似对象归入同一簇,将不相似对象原创 2020-06-28 16:26:28 · 430 阅读 · 0 评论 -
【sklearn篇】mixture.GaussianMixture各参数详解以及代码实现
GaussianMixture参量n_components混合高斯模型个数,默认为 1covariance_type协方差类型,{‘full’,‘tied’, ‘diag’, ‘spherical’}full 指每个分量有各自不同的标准协方差矩阵,完全协方差矩阵(元素都不为零)tied 指所有分量有相同的标准协方差矩阵(HMM 会用到)diag 指每个分量有各自不同对角协方...原创 2020-04-29 14:44:41 · 24765 阅读 · 3 评论 -
【机器学习】KNN算法及其用KNN解决字体反爬
KNN算法及其用KNN解决字体反爬关于KNN算法概要简介原理KNN算法Python实现KNN解决字体反爬web-font介绍例子最后关于KNN算法概要K最近邻(kNN,k-NearestNeighbor)分类算法是数据挖掘分类技术中最简单的方法之一。所谓K最近邻,就是k个最近的邻居的意思,说的是每个样本都可以用它最接近的k个邻居来代表。kNN算法的核心思想是如果一个样本在特征空间中的k个...原创 2019-11-17 15:21:30 · 3384 阅读 · 0 评论 -
【机器学习】为何要归一化和归一化,标准化的处理方法
为何要归一化?如何归一化和标准化?为何要归一化·提升模型的收敛速度·提升模型的精度·总结如何归一化和标准化min-max(0-1) 标准化z-score(标准差) 标准化nonlinearity(非线性) 归一化为何要归一化·提升模型的收敛速度如下图,观察x1,x2的取值范围,x1的范围比x2的范围不是一个对等的量级,得到的曲线会比较尖锐,假如只有这两个特征,对其进行优化时,会得到一个窄长的...原创 2019-11-16 18:07:27 · 3117 阅读 · 0 评论