- 博客(2)
- 资源 (3)
- 收藏
- 关注
原创 Python-制作可视化词云
目录目录一.对于可视化词云的理解二.python的代码实现(1)实现步骤(2)代码说明1.导入需要的库2.读取数据3.去掉停止词4.统计词频5.显示词云6.结果图三、自定义背景图一.对于可视化词云的理解对人、物、事的文本描述中,大量出现的词可以用于这些对象的标签,将这些标签按照词频的大小以图片的方式展示出来,就成为了可视化的个性化词云。...
2018-07-18 16:07:05 3811
原创 NLP-UnicodeDecodeError: 'utf8' codec can't decode byte 0xe6 in position 0: invalid continuation byte
记录使用simhash和 CountVectorizer计算文本相似性时遇到的问题,,主要是我线下的Windows系统使用的是python3.5,线上评测使用的是python2.7。。。问题:UnicodeDecodeError: ‘utf8’ codec can’t decode byte 0xe6 in position 0: invalid continuation byte...
2018-07-07 00:35:11 4658
Integration of artificial intelligence activities
2017-12-20
jaxen-1.1.6.jar+dom4j.1.6.1.jar
2017-11-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人