大数据项目 :利于TF-TI和情感分析发现假新闻
什么是假新闻?
假新闻一般是夸大其辞的,通过网络达到迅速传播的新闻.通过检查特定的词汇分析感情,和算法可以推演出是否是假新闻
TfidfVectorizer ?中文用jieba
TfidfVectorizer可以把原始文本转化为tf-idf的特征矩阵,从而为后续的文本相似度计算,主题模型(如LSI),文本搜索排序等一系列应用奠定基础。利于算法量化文字
[tfidf介绍](https://zhuanlan.zhihu.com/p/67883024)
PassiveAggressiveClassifier?
翻译
2020-12-08 21:44:24 ·
268 阅读 ·
0 评论