前言
续上篇《Python爬虫 获得淘宝商品评论》用python实际应用了一把。今天试着用python试玩一词云。从客户搜索的关键字中分析下客户的喜好,从而去优化宝贝标题,提高宝贝曝光率。
“词云”是对文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨
正文
0x01 数据来源
数据来源是 淘宝直通车表,下载是excel文档,筛选二级类目“染发烫发”,得到相关关键字列表,然后统一贴至txt中。我收集了下列数据并存放至ranfa.txt中
文件名 |
---|
07月26日TOP20万词表PC.xlsx |
07月26日TOP20万词表无线.xlsx |
06月27日TOP20万词表PC.xlsx |
06月27日TOP20万词表无线.xlsx |
05月23日TOP20万词表无线.xlsx |
4月25TOP20万词表无线.xlsx |
0x02 代码
安装wordcloud 和 相关库存。详细安装说明
python库名 |
---|