可参考资料 1)中文分词基本算法介绍 2)ICTCLAS 汉语词性标注集 3)文本分类技术 4)文本分类与SVM 5)基于贝叶斯算法的文本分类算法 6)基于libsvm的中文文本分类原型 7)LDA-math-文本建模 8)情感分析资源 9)面向情感分析的特征抽取技术研究 9.1)斯坦福大学自然语言处理第七课-情感分析 10)深度学习、自然语言处理和表征方法 11)Deep Learning in NLP (一)词向量和语言模型 中文分词 1)这是相对于英文文本情感分析,中文独有的预处理。 2)常用方法:基于词典、基于规则、基于统计、基于字标注、基于人工智能。 3)常用工具:哈工大—语言云、东北大学NiuTrans统计机器翻译系统、中科院张华平博士ICTCLAS、波森科技、结巴分词、Ansj分词,HanLP。