自然语言处理
守望者白狼
深度强化学习、深度学习、自然语言处理 https://github.com/wolf-bailang
展开
-
自然语言处理(资源篇)
记录自然语言处理领域最新的理论解读、项目实例、开源代码库、视频、书籍等资讯原创 2019-01-07 15:00:16 · 633 阅读 · 1 评论 -
NLP方法
分词MM法(正向最大匹配法)RMM法(逆向最大匹配法)BMM法(双向最大匹配法)HMM(隐马尔可夫模型)CRF(条件随机场)jieba中文分词工具词性标注jieba中文词性标注工具北大词性标注集宾州词性标注集命名体识别(NER)正则化表达式+jieba分词CRF(条件随机场)关键词提取TF-IDF算法TextRank算法主题模型算法(LSA、LSI、LDA、wor...原创 2019-01-08 20:55:00 · 1269 阅读 · 0 评论 -
自然语言处理 数据集(更新于2020.04.19)
安然数据集:安然集团高级管理层的电子邮件数据。亚马逊评论:3500万条来自亚马逊的评论,时间长度为18年。数据包括产品和用户信息、评级等。Google Books Ngram:来自Google书籍的词汇集合。博客语料库:从blogger.com收集的681,288篇博客文章。每个博客至少包含200个常用的英语单词。维基百科链接数据(Wikipedia Links data):维基百科全文。...原创 2019-01-13 15:47:06 · 5375 阅读 · 3 评论