python
文章平均质量分 82
主要为语音识别的模型学习,和大家一起学习讨论
AlbertOS
争取0 error,0 warning
展开
-
NLP算法-情绪分析-snowNLP算法库
SnowNLP是一个python写的类库,可以方便的处理中文文本内容。SnowNLP的技术框架参考了英语自然语言处理工具库TextBlob,不过SnowNLP不引用NLTK库,所有的算法都是isnowfy大神实现的。原创 2022-10-26 10:09:44 · 2198 阅读 · 0 评论 -
NLP算法-关键词提取补充知识-停用词表
书接上回,我们讲这个关键词提取的时候没有说停用词;那啥是停用词呢?当一个词语出现频率很高但是这个词并不是你所需要的信息,这个时候就会用到停用词表这个概念原创 2022-10-25 17:02:18 · 1306 阅读 · 0 评论 -
NLP算法-关键词提取之Gensim算法库
Gensim 是一款开源的第三方 Python 工具包,用于对原始的非结构化的文本进行无监督地学习,从而得到文本隐层的主题向量表达。它支持包括 TF-IDFTF−IDF,LSALSA,LDALDA 和 word2vecword2vec 在内的多种主题模型算法,支持流式训练,并提供了诸如相似度计算,信息检索等一些常用任务的接口。原创 2022-10-25 15:17:06 · 2536 阅读 · 0 评论 -
NLP算法-关键词提取之Jieba算法库
为了方便用户快速了解文章的中心主题,会抽取文章的一些中心词来表达文章的中心思想。**关键词抽取就是通过一定的方法抽取出能表达文章的中心主题的一系列方法**。在信息爆炸的时代,很多信息我们无法全面接收,我们需要从中筛选出一些我们感兴趣的或者说对我们有用的信息进行接收。怎么选择呢,关键词提取就是其中一个很好的方法。如果我们可以准确地将所有文档都用几个简单的关键词描述出来,单看几个关键词就可以了解一篇文章,这样会大大提高我们的信息获取效率。原创 2022-10-25 14:57:04 · 2717 阅读 · 0 评论 -
NLP算法-命名实体识别
与自动分词、词性标注一样,命名实体识别也是自然语言处理的一个基础任务,是信息抽取、信息检索、机器翻译、问答系统等多种自然语言处理技术必不可少的组成部分。其目的是识别语料中人名、地名、组织机构名等命名实体。由于这些命名实体数量不断增加,通常不可能在词典中穷尽列出,且其构成方法具有各自的规律性,因此,通常把对这些词的识别在词汇形态处理(如汉语切分)任务中独立处理,称为命名实体识别( Named Entities Recognition,NER )原创 2022-10-25 14:13:28 · 6630 阅读 · 0 评论 -
NLP算法-词性标注
在自然语言分析中,机器需要模拟理解语言。为了实现这一点,自然语言处理过程中必须在一定程度上能够了解自然语言的规则。首先需要理解的是词,特别是每一个词的性质,判断它是一个名词还是一个形容词?如果它是一个动词的屈折形式,那么它的不定形式是什么,以及该屈折形式使用了什么对应的时态、人称和数?这个任务被称为词性标注。原创 2022-10-25 11:17:44 · 3208 阅读 · 0 评论 -
NLP算法-中文分词工具-Jieba
jieba的主要功能是做中文分词,可以进行简单分词、并行分词、命令行分词,当然它的功能不限于此,目前还支持关键词提取、词性标注、词位置查询等。更让人愉悦的是jieba虽然立足于python,但同样支持其他语言和平台,诸如:C++、Go、R、Rust、Node.js、PHP、 iOS、Android等。所以jieba能满足各类开发者的需求。原创 2022-10-25 11:08:58 · 3957 阅读 · 0 评论 -
NLP算法-基于 Jieba 的词频统计
在一份给定的文件里,词频(term frequency,TF)指的是某一个给定的词语在该文件中出现的次数。一个词语出现的次数越多,越表明是该文件的核心词汇,该词语对于快速理解文章具有重要的意义。词频统计是自然语言处理技术中最基础的技术之一,在词频统计中,如何区分词是很关键的一环。原创 2022-10-25 10:56:23 · 2611 阅读 · 0 评论 -
头歌平台-人工智能技术应用-实践学习与答案2(补充实训部分)
本篇博客是对上次实验内容的补充,老师是分两个阶段发出来的实验内容,之前的实验已经发出博客了,之前实验还没做的可以看[头歌平台-人工智能技术应用-实践学习与答案](https://blog.csdn.net/Albert_weiku/article/details/127285845)原创 2022-10-25 10:29:59 · 8154 阅读 · 5 评论 -
头歌平台-人工智能技术应用-实践学习与答案
这个实验很简单真正要写的只有从begin到end中间的几个函数,看清楚流程做起来很简单的(python入门就是这么简单)本科的人工智能技术就是一个笑话,算法也不会跟大家讲的很明白,全都是不断的调用库函数,做调参员;真正的人工智能的岗位都是要去研究算法细节的,这个实验没有啥指导性的作用,只是让大家了解一下NLP领域的一些常用的算法库的使用,大家有兴趣可以深入学习一下。原创 2022-10-12 16:52:38 · 9031 阅读 · 0 评论 -
Django学习
AI教程https://www.yuque.com/wudangniu/uela5m/ig3pfuDjango介绍-框架简介网站、微信公众号、小程序后端开发哔哩哔哩数据爬取和仿bili网站建立原创 2022-02-22 09:16:43 · 539 阅读 · 0 评论 -
PCA算法的学习
引入主成分分析(Principal components analysis,简称PCA)是最重要的降维方法之一。在数据压缩消除冗余和数据噪音消除等领域都有广泛的应用。一般我们提到降维最容易想到的算法就是PCA。PCA算法主要用于(1)高维数据集的探索与可视化。2)数据压缩。3)数据预处理。4)图象、语音、通信的分析处理。5)降维(最主要),去除数据冗余与噪声。1 PCA的思想PCA顾名思义,就是找出数据里最主要的方面,用数据里最主要的方面来代替原始数据。具体的,假如我们的数据集是n维的,共有m个数据原创 2022-01-11 11:42:16 · 3633 阅读 · 0 评论 -
django下删数据表后重建,最好利用django模型来操作
引入我在做djando项目时修改了models类的属性,但是里面已经有数据了,运行migrate迁移失败。原因:在django框架下生成数据表,是用Model类来继承生成的,如果对里面的字段要修改,但是因为表中还有些遗留数据,有时会无法生成新的表结构。这时候想到的一个简单暴力的方法就是直接sql操作数据库,删除数据表,但是这么做会引起django迁移版本混乱的问题,不建议这么操作;如果已经sql删除了,还是有补救办法,可以参考第二部分和第三部分。建议操作还是第一部分的方法。第一种方式:利用Model原创 2021-12-21 09:04:43 · 798 阅读 · 1 评论 -
极客营python学习
python基础python基础的教程Anaconda环境安装这个比原生的python用起来更方便python语法的一些笔记Python 是动态类型编程语言Python 即可以面向对象编程,也可以面向函数编程面向对象思想:创建一个汽车,然后调用汽车 run 方法面向函数思想(过程):写个函数,函数里面让 4 个轮子扛着一个沙发同样的速度跑起来变量和简单的赋值语句对象和引用Python 中,一切皆对象。每个对象由:标识(identity)、类型(type)、value(值)组成。对象的本原创 2021-12-11 08:48:41 · 408 阅读 · 0 评论 -
kaldi模型的学习
kaldi模型的安装最近正在学习安装语音识别,就此对语音识别最为常用的kaldi模型的安装过程和大家分享一下,感谢CSDN中的大神写的博客!!一.简介Kaldi是使用C++编写的语音识别工具包,Apache License v2.0许可。主要供语音识别研究人员使用。Kaldi的目标和范围与HTK类似。目标是拥有易于修改和扩展的现代而灵活的代码。有着极强的可扩展性,飞桨中Deepspeech等就是基于kaldi开发的二、kaldi的安装1、下载kaldi一般的训练模型不要在Windows上尝试,配原创 2021-10-18 10:53:28 · 876 阅读 · 0 评论