缓存笔记:关于NLP的一些项目

该篇笔记,主要是来自网络的大杂烩,用于学习记录之用,在此感谢各位博主,如有侵权,立马删除

一、缓存记录一

来自于刘焕勇博主,文章地址:https://blog.csdn.net/lhy2014/article/details/82954509

他的github主页:https://github.com/liuhuanyong,github项目主页:https://liuhuanyong.github.io

1.语言资源构建
项目名称中文名称项目技术点
SentimentWordExpansion情感词扩展SOPMI
BaikeInfoExtraction百科信息抽取Urllib,xpath
SougouWordCollector搜狗词库自动构建Urllib,Scrapy
LanguageResources语言资源语言资源库,语义库,常用词典
BaikeKnowledgeSchema百科知识体系构建Urllib,xpath,递归,知识库本体概念
2.自然语言处理基本组件
项目名称中文名称项目技术点
WordSegment分词HMM, MAXCUT,Ngram
HuanNLP自然语言处理组件HMM, maxent, CRF
Pinyin2Chinese拼音转文字Trie树,HMM, bigram
QueryCorrection查询纠错edit-distance
ChineseCixing中文词形查询字形,音形
ChineseAntiword中文反义词查询反义词
3.信息抽取
项目名称中文名称项目技术点
WordMultiSenseDisambiguation中文多义词词义消歧百科知识库,词义语义表示,词义语义相似度计算
TextFeatureExtraction文本特征提取IG,CHI ,DF,MI
WordCollocation搭配抽取MI
KeyInfoExtraction关键信息提取TFIDF,TextRank
EventTriplesExtraction事件三元组提取dependency parser
知识图谱与事理图谱
项目名称中文名称项目技术点
PersonRelationKnowledgeGraph中文人物关系图谱bootstrapping, 远程监督, 训练数据回标, 关系抽取
CrimeKgAssitant法律罪行智能助手知识图谱, 智能预判, 自动问答
QASystemOnKG医疗知识图谱与自动问答知识图谱构建及自动问答
ComplexEventExtraction复合事件图谱复合事件,条件事件、反转事件抽取
CausalityEventExtraction因果事件图谱因果图谱,因果事件抽取
SequentialEventExtration顺承事件图谱动宾短语提取,事件图谱
LanguageKnowledgeGraph语言政策知识图谱Neo4j,Echarts,D3js
HyponymyExtraction上下位关系图谱模式匹配,上下位概念表示
MusicLyricChatbot歌词对对碰es搜索,歌词知识库
4.文本挖掘与社会计算
项目名称中文名称项目技术点
WeiboIndexSpyder微博指数采集selenium,xpath
BaiduIndexSpyder百度指数采集xpath,selenium
AliIndexSpyder阿里指数采集selenium,xpath
DocSentimentAnalysis基于句法依存的情感分析Template, Dependencyparser
LearningBasedSentiment基于深度学习的情感分析CNN,RNN,ML
TextGrapher文本结构化图谱表示EventExtraction,知识表示
ImportantEventExtractor文本重要性计算textrank
ZhuguanDetection文本主观性计算subjective knowledge base
SentenceSimilarity句子相似度计算distance, hash, haiming ,eidtdistance
TopicCluster文本话题聚类LDA,Kmeans
EventMonitor特定事件追踪新闻采集,事件监测架构,scrapy
PoemMining中国古代诗词挖掘语料库构建,文本挖掘
LawCrimeMining司法文本挖掘语料库构建,文本挖掘
HumorMining幽默计算语料库构建,文本挖掘
LanguagePlatform集成自然语言处理技术的语言平台Neo4j,Echarts,Django
5.深度学习与语义表示
项目名称中文名称项目技术点
ChineseTextualInference中文文本蕴含/推理Textual entailment, keras, 文本分类
SiameseSentenceSimilaritysiamese相似问句匹配siamese lstm network, keras, 文本分类
MedicalNamedEntityRecognition中文电子病例命名实体识别keras, bi-lstm-crf
ChineseEmbedding中文向量大全(字符向量、词向量、拼音向量、依存向量、词性向量)SKIP-GRAM,Co-Matrix
Word2Vector词向量表示CBOW, SKIP-GRAM,Co-Matrix
Sentence2Vector句子向量表示CBOW
Seq2SeqTranslation端到端的翻译模型keras, lstm
6.其他

@@1.医药领域知识图谱快速及医药问答项目:
原文:https://blog.csdn.net/lhy2014/article/details/82953792
github地址:https://github.com/liuhuanyong/QASystemOnMedicalKG

@@2.中国古代诗词文本挖掘项目:
原文:https://blog.csdn.net/lhy2014/article/details/82956612
github地址:https://github.com/liuhuanyong/PoemMining

@@3.基于法律罪行知识图谱的智能预判与客服问答:
原文:https://blog.csdn.net/lhy2014/article/details/83962640
github地址:https://github.com/liuhuanyong/CrimeKgAssitant

@@4.中文电子病例命名实体识别项目
原文:https://blog.csdn.net/lhy2014/article/details/84582145
github地址:https://github.com/liuhuanyong/MedicalNamedEntityRecognition

@@5.中文现代诗歌创作项目
原文:https://blog.csdn.net/lhy2014/article/details/85227231
github地址:https://github.com/liuhuanyong/PersonalModernPoems

@@6. 啊哈自然语言处理包
https://gitee.com/chinahuik/AHANLP

--------------------------------------------------待完善

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

荣•厚德载物

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值