内容安全实验
文章平均质量分 95
宫水二叶
这个人真勤快,写了一句话。
展开
-
KALDI运行yesno和TIMIT实例
文章目录写在前面一、部署KALDI1. 下载并解压KALDI工具箱2. tools中执行extras/check_dependencies.sh脚本,根据其输出安装依赖库直到输出ALL OK3.make4. src中执行./configure –shared5. src中执行make depend和make二、运行yesno项目实例,简要解析发音词典内容,画出初步的WFST图1. 下载并划分数据集2. 建立词典3. 构造语言模型4. MFCC特征提取和GMM-HMM建模5. 查看结果三、调整并运行.原创 2021-05-29 10:06:00 · 1006 阅读 · 0 评论 -
基于SVM,KNN,CNN的数字图像识别
文章目录一些瞎扯的话一、必备的有关 OpenCV 和 HOG 的前置知识1.关于OpenCV模块:图片读、写和显示操作,以及图片属性2.关于OpenCV模块:图片缩放和仿射变换3.有关 HSV 空间, Gramma变换, HOG 特征的知识。二、用 OpenCV 的仿射变换实现图片缩放三、理解 HOG、ORC 过程,使用SVM 和 KNN 模型实现数字图像的识别1.数字图像的类型2.提取数字图像的HOG特征3.训练模型并测试四、使用 CNN 神经网络模型实现数字图像的识别1.处理图像数据2.设置模型,训练.原创 2021-05-04 22:26:21 · 4379 阅读 · 13 评论 -
基于 nltk 模块中的朴素贝叶斯模型的文本分类任务
基于 nltk 模块中的朴素贝叶斯模型的文本分类任务前言一、安装并导入工具包二、统计词频:我们对整个语料库统计词频形成词表,并选取每个类别70%的文件作为训练集,30%的文件作为测试集三、去除停用词四、生成用于分类的词表(去除部分高频词)五、获取文本特征六、贝叶斯分类器训练七、准确率计算八、不去除停用词和去除停用词的准确率结果对比和思考九、代码总和前言基于 nltk 模块中的朴素贝叶斯模型的文本分类任务:文本共包含七个类别,每个类别包含200个文本。一、安装并导入工具包安装并导入工具包:.原创 2021-04-23 00:19:25 · 791 阅读 · 3 评论 -
基于 word2vec 模型的文本分类任务
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档基于 word2vec 模型的文本分类任务前言一、安装并导入工具包二、获取词表三、训练模型四、统计词频四、获取特征向量五、准确率计算六、代码总和前言基于 word2vec 模型的文本分类任务:文本共包含七个类别,每个类别包含200个文本。一、安装并导入工具包本实验主要使用到的工具包有 gensim 包, jieba 包, numpy 包和re 包。安装 gensim 模块命令如下,其他模块类似:二、获取词表依次遍历原创 2021-04-16 00:06:35 · 6183 阅读 · 13 评论 -
爬取当当图书排行榜(榜单自选),格式:爬取结果包含但不限于[排名 书名 作者],注意输出格式对齐
这里写自定义目录标题爬取当当图书排行榜查看当当图书排行榜,分析其网址各部分代表的意义,选取特定分类和时间区间进行爬取解析网页内容,查看所需信息(排名,书名,作者,出版社,价格)的位置;筛选所需数据,输出并保存,尝试输出对齐爬取当当图书排行榜一个课堂作业,使用re,BeautifulSoup等模板爬取当当图书排行榜(榜单自选),本篇重点在输出格式对齐那里,完整代码在结尾。查看当当图书排行榜,分析其网址各部分代表的意义,选取特定分类和时间区间进行爬取进入多个页面,仔细分析网址变化,可以发现网址最后的‘原创 2021-04-04 18:37:13 · 1331 阅读 · 5 评论 -
python求音频的梅尔倒谱系数
文章目录写在前面一、必备的关于音频的知识1.关于采样率2.关于波形图,声谱图二、音频的梅尔倒谱系数的含义和求解步骤1. 梅尔倒谱系数的含义2. 梅尔倒谱系数的求解步骤概括三、求梅尔倒谱系数详细过程1. 预加重、分帧和加窗处理2. 用周期图(periodogram)法来进行功率谱(power spectrum)估计;(短时傅里叶变换)3.对功率谱用Mel滤波器组进行滤波,计算每个滤波器里的能量,对每个滤波器的能量取log3. 进行离散余弦变换(DCT)变换,保留DCT的第2-13个系数四、代码总和写在前.转载 2021-05-14 19:24:13 · 3646 阅读 · 15 评论