没啥用的词,并且大量出现叫做停用词
关键词提取 tf-idf
提取出文章中比较有代表性的文字,这里面就是蜜蜂和养殖
相似度
搜狗新闻文本分析实例
https://blog.csdn.net/Arthur_Holmes/article/details/99431106
https://nbviewer.jupyter.org/github/nightsswatch/MLProject/blob/master/Python%E6%96%87%E6%9C%AC%E5%88%86%E6%9E%90/news_C.ipynb
https://github.com/nightsswatch/MLProject/blob/master/Python%E6%96%87%E6%9C%AC%E5%88%86%E6%9E%90/news_C.ipynb