文本聚类
文章平均质量分 62
栗子ma
这个作者很懒,什么都没留下…
展开
-
【NLP】Python中文文本聚类
1. 准备需要进行聚类的文本,这里选取了10篇微博。import ospath = 'E:/work/@@@@/开发事宜/大数据平台/5. 标签设计/文本测试数据/微博/'titles = []files = []for filename in os.listdir(path): titles.append(filename) #带BOM的utf-8编码的txt文件时...原创 2018-07-18 10:08:50 · 22074 阅读 · 12 评论 -
【NLP】Python英文文本聚类
【原文链接】http://brandonrose.org/clusteringIn this guide, I will explain how to cluster a set of documents using Python. My 目标例子 is to identify the 潜在的 structures within the 摘要 of the top 100 films of a...翻译 2018-07-13 17:08:20 · 14135 阅读 · 4 评论