ChineseZhuguanDectection
项目地址:https://github.com/liuhuanyong/ZhuguanDetection
Chinese Subjective Dectection based on subjective knowlegebase, 基于中文主观性知识库的句子主观性评定方法。
#项目介绍
主观性是中文舆情和文本挖掘一个必不可少的一项环节。
对于英文而言,我调研过textblob的主观性接口,对于输入一个句子,textblob用的是词语主观性词典+加权的打法,相应的介绍可以查看我的总结材料(documents下的pdf文件)
而针对目前github开源平台上还缺少有对中文句子主观性评定的接口,本项目将尝试弥补这一空缺。
本项目将从中文自身的特点出发,通过总结并挖掘中文句子主观性线索知识库和客观性线索知识库,提供一个面向中文句子的主观性判定方法。
主观性字典
- degree_words.txt:程度副词,221个
- deny_words.txt:否定副词,29个
- lianci_words.txt:连词,93个
- nengyuan_words.txt:能愿副词,719个
- pingjia_words.txt:评价词,6846个
- qingtai_words.txt:情态动词,29个
- rencheng_words.txt:人称代词,32个
- senti_words:情感词,2090个
- tanci_words: