![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
【NLP】
文章平均质量分 74
自然语言处理
Ezrealmore
Ezrealmore,更简单一点
展开
-
【NLP】机器学习中的判别模型和生成模型
两个模型是啥我们从几句话进入这两个概念: 1、机器学习分为有监督的机器学习和无监督的机器学习; 2、有监督的机器学习就是已知训练集数据的类别情况来训练分类器,无监督的机器学习就是不知道训练集的类别情况来训练分类器; 3、所以说,有监督的机器学习可以抽象为一个分类task,而无监督的基本完成的是聚类; 4、有监督的机器学习中,我们可以概述为通过很多有标记的数据,训练出一个模型,然后利用这个,对原创 2016-08-29 15:13:43 · 7183 阅读 · 1 评论 -
【NLP】CNN、RNN与LSTM(转)
神经网络技术起源于上世纪五、六十年代,当时叫感知机(perceptron),拥有输入层、输出层和一个隐含层。输入的特征向量通过隐含层变换达到输出层,在输出层得到分类结果。早期感知机的推动者是Rosenblatt。(扯一个不相关的:由于计算技术的落后,当时感知器传输函数是用线拉动变阻器改变电阻的方法机械实现的,脑补一下科学家们扯着密密麻麻的导线的样子…) 但是,Rosenblatt的单层感知机有一个转载 2016-08-30 11:34:12 · 8174 阅读 · 0 评论 -
【NLP】TF-IDF
有一个词a,有一个语料D,D中有n篇文档TFTF,Term Frequency的缩写,中文为词频,意思是一个词在某一语料库中出现的次数频率,用公式表达就是这样:a在这篇语料库中出现的次数语料库的词汇总数\frac{a在这篇语料库中出现的次数}{语料库的词汇总数}IDFIDF,Inverse Document Frequency的缩写,中文为逆文档频率,意思是这个词在所有语料中的分布情况,用公式表达:原创 2016-09-13 17:35:29 · 4508 阅读 · 0 评论 -
【NLP】pyhanlp的安装与使用
介绍pyhanlpHanLP是由一系列模型与算法组成的Java工具包,目标是普及自然语言处理在生产环境中的应用。HanLP具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。HanLP有如下功能:中文分词词性标注命名实体识别依存句法分析关键词提取新词发现短语提取自动摘要文本分类拼音简繁安装pyhanlppip install pyhanlp安装后在第一次使...原创 2019-05-08 17:47:35 · 20195 阅读 · 9 评论 -
【NLP】基于python的gensim word2vec训练词向量
准备工作当我们下载了anaconda后,可以在命令窗口通过命令conda install gensim安装gensimgensim介绍gensim是一款强大的自然语言处理工具,里面包括N多常见模型,我们体验一下:interfaces – Core gensim interfacesutils – Various utility functionsmatutils – Math utilscor原创 2016-10-12 17:18:37 · 41028 阅读 · 12 评论 -
【NLP】根据音频文件自动生成字幕(中文)
根据音频文件自动生成字幕(中文)原创 2019-11-12 13:43:23 · 11429 阅读 · 1 评论