一弦-sring-CSDN博客

原创数据预处理

数据预处理是从数据中检测，纠正或删除损坏，不准确或不适用于模型的记录的过程可能面对的问题有：数据类型不同，比如有的是文字，有的是数字，有的含时间序列，有的连续，有的间断。也可能，数据的质量不行，有噪声，有异常，有缺失，数据出错，量纲不一，有重复，数据是偏态，数据量太大或太小数据预处理的目的：让数据适应模型，匹配模型的需。sklearn模块：preprocessing（几乎包含预处理所有内容）Impute（填补缺失

2020-06-14 21:51:43 523 1

原创机器学习—逻辑回归(logistics regression)、朴素贝叶斯(Naive Bayesian)

软分类是直接根据概率值进行判断的，求解两种概率P（y=1）和P（y=-1），然后对概率值进行比较，判断所属类别，如下：注意：虽然逻辑回归得到了概率值，但是它是进行了置信区间的变换，是类概率，并不是真正意义上的概率，只有朴素贝叶斯是真正意义上对应的概率值。1. 逻辑回归(logistics regression)说明：名字是一种音译，是一种名为“回归”的分类目标：通过sigmoid函数计算P

2020-06-14 20:43:27 824

原创机器学习 — SVM（支持向量机），PLA（感知机），LDA（线性判别分析）

硬分类是直接根据决策边界进行判断的，直接区分+1和-1两种类别，如下：注意：w和x作为向量，索引取值如果是从0、1、2、……、n，那么i=0的时候，对应的w0x0是阈值，如果没有阈值，那么该超平面就是始终过原点的。1. 线性SVM思想：几何间距目标：找到几何间距margin，处理线性可分问题，详情见SVM介绍。对应的非线性问题处理方法是：非线性VM2、PLA思想：错误驱动，根据输出和预

2020-06-14 20:34:23 2349

原创特征选择—过滤法(Filter)、嵌入法(Embedded)和包装法(Wrapper)

一、过滤法（Filter）目的：在维持算法表现的前提下，帮助算法们降低计算成本特点：独立操作，不与后续分类（或者回归）模型相关过程：目标对象：需要遍历特征或升维的算法。最近邻算法KNN，支持向量机SVM，决策树，神经网络，回归算法等遍历特征或升维运算，本身的运算量很大，需要的时间很长，因此特征选择很重要。随机森林不需要遍历特征，每次选的特征就很随机，并非用到所有的特征，所以特征选择作用不大。思考：过滤法对随机森林无效，却对树模型有效？解释：传统决策树需遍历所有特征，计算不纯度后分枝.

2020-06-14 20:22:15 11882 1

原创神经网络——MLP（多层感知机）和RBF（径向基函数神经网络）

一、整体概念神经元激活值和激活函数二、MLP三、RBF参考：Principles of training multi-layer neural network using backpropagationRBF神经网络是什么？RBF（径向基）神经网络学堂在线：数据挖掘：理论与算法，清华大学，袁博老师炼数成金：机器学习及其MATLAB实现—从基础到实践...

2020-06-14 18:06:49 2797

原创降维—PCA

1. 定义：将现有特征映射到一个新的特征空间中，然后得到新的特征。特点：维度降低，数据改变。2. 目的：算法运算更快效果更好；数据可视化3. 衡量指标：样本方差，又称可解释性方差，方差越大，特征所带的信息量越多。其中，Var表示某特征的方差，n代表样本量，xi表示某特征中的各样本取值，x’代表该特征对应样本的均值。4. 方法：矩阵分解。用来找出n个新特征向量，让数据能够被压缩到少数特征上并且总信息量不损失太多的技术。5. 操作过程：6. 举例：原数据是二维的（x1和x2）

2020-06-14 17:13:54 241

原创决策树和随机森林

一、决策树二、随机森林定义：多棵随机数用随机的方式建立一个森林，决策树间是没有关联的。（集成算法）目的：多棵树同时进行判断，并以少数服从多数的方式输出最后结果，提高准确度。（民主的投票表决比独裁的判断，犯错的概率要小很多！）训练方式：每棵树训练的时候，随机有放回地取全部数据的一部分进行学习。Why每次只取部分数据? 随机的本质，为防止数据相同导致所有树的判断结果类似，避免失去民主投票意义。参考深入浅出理解决策树算法（一）-核心思想深入浅出理解决策树算法（二）-ID3算法与C4.5算

2020-06-13 22:48:39 217

原创分类（Classification）算法评估指标

混淆矩阵（Confusion Matrix）：真实值，预测值，预测值和真实值之间的关系。True positive (TP) ：图中的11，真实值为Positive，预测正确（预测值为Positive）True negative (TN)：图中的00，真实值为Negative，预测正确（预测值为Negative）False positive (FP)：图中的01，真实值为Negative，预测错误（预测值为Positive）False negative (FN)：图中的10，真实值为Positiv

2020-06-13 22:36:37 1056

原创 SVM发展及算法介绍

一、几个概念二、SVM的发展三、SVM的算法四、SVM中DET及ROC曲线参考菜菜的scikit-learn课堂 — sklearn中的支持向量机SVMSVM：任意点到超平面的距离公式深入理解拉格朗日乘子法（Lagrange Multiplier) 和KKT条件学堂在线：数据挖掘：理论与算法，清华大学，袁博老师11565 P-R、ROC、DET 曲线及 AP、AUC 指标全解析（上）...

2020-06-13 22:10:09 1400

原创 GMM-EM算法

一、 GMM（高斯混合模型）本质：通过几个高斯的加权组合，描述某个变量x的分布（分类）情况（聚类算法）说明：同一个变量x，可以属于不同的高斯模型，每个模型对应的加权（也就是概率）是不一样的。公式二、EM（期望最大法）三、GMM-EM原理参考：高斯混合模型与EM算法的数学原理及应用实例学堂在线：数据挖掘：理论与算法，清华大学，袁博老师【机器学习】【白板推导系列】：EM算法&高斯混合模型从投币试验看EM算法...

2020-06-13 21:21:16 306

原创机器学习简介

1、回归是用来处理连续的问题，分类用来处理分类的问题。从回归到分类，一般是通过激活函数f(x)的映射来实现，常用的激活函数有sigmoid函数，符号函数等，如下：2、线性分类是对未经处理的原始数据，进行完整的、全局的线性可分的处理。加工后的数据：特征选择数据进行分段讨论：决策树3、线性分类处理的都是线性可分的问题，根据分配的依据原则，可以分为软分类和硬分类两种。其中，硬分类是根据决策边界进行分类的，直接得到-1和1两类；软分类是根据概率值p(Y=1)和P(Y=-1)进行分类的，比较概率值的大小，.

2020-06-13 20:42:35 371

原创 LPCC、MFCC和CQCC简介及matlab实现

一、LPC和LPCC1、LPC假设：当前信号的值x(n)，可以用过去p个取样值的加权和s(n)^来预测其中，s(n)^为预测值，s(n)为真实值，加权系数a1、a2、a3…ai称为p阶线性预测系数。LPC分析：对于预测误差滤波器而言，求其预测系数a1、a2、a3…ai，使得预测误差e(n)在某种预测条件下最小的过程。A(z)称为LPC误差滤波器，用于求p阶参数。最小准则：常用...

2020-03-21 20:47:08 14579 6

原创频谱、倒谱介绍及matlab实现

一、频谱fft函数的区间正频率区间的方式（fftshift）采样频率（区间图）二、能量谱傅里叶变换的平方三、功率谱1、能量谱/区间2、自相关函数傅里叶变换四、倒谱1、定义：2、过程：（图）之所以在分析中用的不是能量谱，可能是因为二者之间差了^2，在后续的ln中变为系数2，关系不大。倒谱：是实部求逆变换，也叫实倒谱，用于估计语音参数复倒谱：与实倒谱相差一个因子，用于...

2020-03-20 19:11:44 12473 3

原创傅里叶变换（FS、FT、DTFT、DFT、DFS、FFT）、拉普拉斯变换和Z变换

傅里叶变换的目的：时域转为频域，滤波，求解微分方程等FS（Fourier Series）傅里叶级数：时域周期连续，频域离散。任何信号都可以看作是无限多的正弦波的叠加时域：基本单位是1s频域：基本单位w(基础是cos(wt))代表“1”；代表“0”的是sin(wt)，是直流分量注意：频率的单位是w（或者f=w/2Π），是实数，而不是附属jw或者e^jw，幅度谱：正面看，即时域...

2020-03-19 13:43:31 22913 3

原创经验模式分解（EMD）及希尔伯特-黄变换（HHT）简介及matlab实现

本文介绍过程涉及到两个链接工具包，可以自己网上搜索，也可以在以下网盘下载：https://pan.baidu.com/s/1G8JdRhgBz8jFyehrgqZjMQ 提取码：x3un ，因为作者主要做语音方面工作，所以后面的说明主要以说话人识别为例。一、经验模式分解（EMD）关于经验模态分解的概念，网上有很多具体的讲解，这里就不进行细说，具体过程可以参考https://blog.csdn...

2020-03-17 11:32:30 39140 49

原创听觉器官及机理

外耳耳廓、耳壳和外耳道：收集、辨别、扩大声音外耳道有许多共振频率，与语音频率范围相符外耳道长2.5—3.5cm，宽0.6—1cm中耳鼓膜和听骨链（锤骨、砧骨和镫骨）：传声作用，改变增益，气体运动转换为液体运动听骨链相当于杠杆，锤骨连接鼓膜，镫骨连接耳蜗前庭窗，鼓膜：前庭窗=55：3.2内耳前庭窗：接收中耳传过来的信号圆窗：为不可压缩液体缓解压力耳蜗（鼓阶、中阶...

2020-02-25 13:38:28 739 1

原创语音发声机理及发声线性模型

一、生理结构动力源气源：肺和气管激励源声门：喉和声带滤波器：共鸣器声道：咽喉、口腔和鼻腔成年男子的声道平均长度17cm.二、语音生成1、发声原理声门：一侧是“声门子系统”，产生激励振动；一侧是“声道系统”和“辐射系统”（1）浊音声带紧绷，气流来了后，张弛振动，周期性的开启和闭合，形成准周期性的脉冲状空气流（周期为基音周期）。声带越短、厚度越薄、张力越大...

2020-02-24 22:39:11 1559

原创语音信号处理分类

人与人之间的通信：语音压缩与编码压缩语音信号的传输带宽或者降低电话信道的传输码率解释：比特率=位深X采样率X信道个数，比特率越高，还原度越高，速度越慢。所以降低编码比特率，可以节省频率资源。第一类人与机器之间的通信：语音合成机器讲话，人接听文语转换（TTS）系统，主要关注可理解度，自然度，可懂度，逼真度（情感语音合成）第二类人与机器之间的通信：语音识别人讲话，机器接...

2020-02-24 21:15:07 1493

原创语音信号加窗分帧及matlab实现

加窗分帧：时域加窗，点乘；频域卷积，减少泄露解释：语音信号是时变信号，浊音的基音周期、清浊音信号幅度和声道参数均随时间变化，发声器官的惯性运动，可以认为具有短时平稳性。帧长10~30ms，交叠分段方式，为了帧之间平滑过渡，保持连续性，帧移/帧长范围在0-1/2之间。1. 矩形窗：主瓣宽度小，较高频谱分辨率，但是旁瓣峰值较大，频谱泄露严重matlab程序：%时域波形w=rectw...

2020-02-24 19:28:58 6593 1

原创语音信号预加重及matlab实现

预加重：数字语音高频部分进行加重，去除口唇辐射影响，增加高频分辨率解释：根据电力声类比发现，声门激励类比为二阶低通，口唇类比为一阶高通，为了去除语音中声门和口唇辐射的影响，反映声道以及共振峰的性质，所以需要再增加一个一阶高通。（阶数越高，带外衰减越快，滤波效果越好）一阶FIR高通滤波器：传递函数：H(z)=1-αz^(-1) 其中，α取值0.9-1.0预处理后信号：y(n)=x(n)...

2020-02-24 19:27:35 7597 4

原创 matlab中语谱图——specgram函数

specgram(x1,N,fs,window,overlap)：绘制语谱图，其中， x1:语音向量 N：fft个数 fs：采样频率 window：帧长，即加窗处理中的窗长 overlap：帧移，帧长重叠部分，一般重叠部分取50%specgram函数绘制语谱图有两种方式：无输出参数，直接画图有输出参数，可以通过返回值画...

2020-02-24 18:37:29 13317 1

weixin_42846157的博客