TEAM-AG
计算机系硕士研究生 何梓源团队
展开
-
层序SoftMax(Hierarchical Softmax)——CodingPark编程公园
@Hierarchical Softmax原创 2021-06-07 15:13:55 · 603 阅读 · 0 评论 -
情感分析_CodingPark编程公园
基于商品评价的情感分析原创 2020-08-06 15:04:17 · 1577 阅读 · 1 评论 -
切分算法[完全切分 & 正向 & 逆向 & 双向最长匹配 & 速度测评]_CodingPark编程公园
【分词】@Python版本原创 2020-07-06 14:57:44 · 14888 阅读 · 0 评论 -
命名实体识别_利用CRF_CodingPark编程公园
本文主要讲解原始语料库 -> 语料清洗 -> 语料分割 -> 构建训练和测试数据 -> CRF++训练 -> 命名实体检索 -> 模型评估原创 2020-06-08 14:58:09 · 10839 阅读 · 1 评论 -
利用神经网络解决NLP问题【enumerate&one-hot + RNN】_完整项目_CodingPark编程公园
本文主要实现 char_rnn 主攻字符级别预测原创 2020-06-05 21:38:21 · 11129 阅读 · 1 评论 -
利用神经网络解决NLP问题【W2V+SVM】&【W2V+CNN】_完整项目_CodingPark编程公园
本文讲述利用 Word2Vec把文字向量化,随后分别利用SVM与CNN进行学习与测试原创 2020-06-04 11:49:50 · 10855 阅读 · 4 评论 -
Word2vec与logging模块_完整代码_CodingPark编程公园
Word2vec 与 logging模块实战原创 2020-05-25 18:02:06 · 10970 阅读 · 0 评论 -
词性标注-利用HMM_完整项目_CodingPark编程公园
本文主要讲述:使用HMM进行词性标注原创 2020-05-25 17:35:32 · 11058 阅读 · 0 评论 -
隐马尔可夫链_CodingPark编程公园
本文讲述:马尔可夫链 与 隐马尔可夫链原创 2020-05-23 17:10:22 · 9789 阅读 · 0 评论 -
自然语言处理思维导图_CodingPark编程公园
Han-NLP思维导图原创 2020-05-21 22:03:03 · 11336 阅读 · 0 评论 -
Statiscal Machine Translation机器翻译_CodingPark编程公园
本文主要讲述了Statiscal Machine Translation的基本步骤原创 2020-05-21 15:05:18 · 3232 阅读 · 0 评论 -
命名实体识别_利用cocoNLP包_CodingPark编程公园
本文主要讲述利用自然语言处理的技术完成对一段文本命名实体的识别包括:e-mail识别、身份证号识别、手机归属地识别、运营商识别、号码识别、地址识别、时间识别、人名识别 等原创 2020-05-19 11:48:49 · 3671 阅读 · 1 评论 -
英语拼写鉴别器_CodingPark编程公园
本文主要介绍:利用python编写英语拼写鉴别器主要功能:可检查出含有拼写错误的单词且可给出改正建议。主要用到:Enchant ,下载Enchant的过程可以说十分艰辛了,我在本程序对应的博客中有详细图文解释。原创 2020-05-12 14:27:22 · 9654 阅读 · 0 评论 -
从朴素贝叶斯到N-gram语言模型_CodingPark编程公园
从朴素贝叶斯到N-gram语言模型文章介绍在本文中你将会学到朴素贝叶斯是什么、朴素贝叶斯有什么应用、实际工程上的小技巧等N-grame是什么、它比朴素贝叶斯好在哪里等目录朴素贝叶斯N-gram语言模型两个实例代码朴素贝叶斯引言贝叶斯公式 + 条件独立假设 = 朴素贝叶斯贝叶斯方法是一个历史悠久,有着坚实的理论基础的方法,同时处理很多问题时直接而又高效,很多高级自然语言处理...原创 2020-04-19 13:11:19 · 9749 阅读 · 0 评论 -
人工智能中神经网络与自然语言处理共生关系_CodingPark编程公园
文章目录神经网络知识大串联1:第一代的神经元模型 32:从M-P模型到感知器模型 33:前馈神经网络 34:后向传播与BP算法神经网络 45:深度神经网络DNN 46:卷积神经网络CNN 57:循环神经网络RNN 88:神经网络交叉领域实现与应用 9两部分知识的连接自然语言处理知识大串联1:one-hot 112:Word-embeding 词嵌入 113:Word2V...原创 2020-04-13 08:04:29 · 11667 阅读 · 0 评论 -
jieba中文处理[分词、关键词抽取(TF-IDF 算法)(TextRank 算法)]_CodingPark编程公园
文章介绍jieba是一个非常好用的中文工具,是以分词起家的,但是功能比分词要强大很多。本文讲述 jieba 的一些用法 包括:分词、关键词抽取(TF-IDF 算法)(TextRank 算法)等知识扩种jieba支持繁体字比jieba更准确更高端的库 :NLPIR工业界自然语言处理库 :spaCy知识讲解import jieba'''<h1> 分词 ...原创 2020-04-10 17:32:57 · 12833 阅读 · 0 评论 -
LDA主题模型_完整项目_CodingPark编程公园
LDA (Latent Dirichlet Allocation)一些预备知识点,科普一下PLSA -> LDA (Latent Dirichlet Allocation)PLSA 参数随语料大小线性增加;LDA 参数规模与语料大小无关,只取决于topic个数和字典中term总数可以大体理解为:从PLSA 到 LDA 增加的 就是 文章与主题的 Dirichlet分布 与...原创 2020-04-09 13:19:56 · 11070 阅读 · 0 评论