前言:关键词根提取法是最近读君言的文章学习到的。自己试着实现下。代码写的不一定严谨,欢迎拍砖交流。
一、读取 Excel 关键词(仅一列)另存为的txt文件。
import
二、统计top10词根
words
三、读取 Excel,按行进行判断分类,生成字典
# 读取excel,按行进行判断。
四、将生成的 toplist 分类词典存入 Json 文件
import json
js1 = json.dumps(dic2)
jsonfile = open(r'E:Chrome_download关键词根输出词典.json','w')
jsonfile.write(js1)
jsonfile.close()
# 生成json文件,后续可直接读取json文件,避免重复执行。
五、读取 Json 文件
import json
import xmind
with open(r'E:Chrome_download关键词根输出词典.json','r') as f:
load_file = json.load(f)
print(load_file)
六、 循环分类文件,创建 Xmind 子级标题
# 加载或创建xmind文件
workbook = xmind.load(r'E:Chrome_download关键词根提取分类输出2.xmind')
# 创建失败,可以自己创建一个空白的,进行加载。
print(workbook)
# 获取第一个画布
sheet1 =workbook.getPrimarySheet()
sheet1.setTitle('长尾词') # 设置画布名称左下角
# 编辑画布
root_topic1 =sheet1.getRootTopic()
root_topic1.setTitle('如何怎么')
for k,v in load_file.items():
i=0
print(k,v)
sub ='sub_topic'+str(i)
sub= root_topic1.addSubTopic()
sub.setTitle(k)
i=i+1
for value in v:
ii =0
sub2 = 'two_sub_topic'+str(ii)
sub2 = sub.addSubTopic()
sub2.setTitle(value)
ii+=1
# 保存画布
xmind.save(workbook,path=r'E:Chrome_download关键词根提取分类输出2.xmind')
七、最后生成 Xmind 文件预览
小结
本次测试用了4000个关键字,数量并不是太多。xmind仅划分至第三级。若再往下在分,基本上是相同的循环嵌套思路。