- 博客(2)
- 收藏
- 关注
原创 基于Tableau和python的豆瓣热门影评写作中关键词的统计分析研究----2
由于影评文本中通常存在大量的虚词,如“一部、从、自从、到、在、当、于、朝、按、按照、经过、以、根据”等,这些虚词在具有较低的价值密度的同时由于在各条影评中大量出现,若不进行适当处理则会出现低价值或无意义字段在词云图中占据大量位置的情况,因此在及逆行词频统计时应当提前过滤此类无意义字段。r”[\u4e00-\u9fa5]+”中,“\u4e00”与“\u9fa5”分别对应unicode编码中中文字符的始末位置,可以保证做到中文字符的全匹配同时略去影评字符串中的标点符号。通道:位置、大小、色调、方向。
2023-01-12 14:55:57 441
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人