第一步:将文章以句号形式分开,并标号
第二步:使用结巴遍历每一句,并分词
第三步:使用txt导入excel
------------------------------------------------------------------
参考自己的文章:
第一篇:python(给每行开头添加序号)&(每行末尾添加序号)
第二篇:python【jieba】如何换行 (分词同时)| pythonjieba 分词 结束后用txt打开()
------------------------------------------------------------------
省略了部分步骤,可以参考第一篇
代码:
>>> import jieba
>>> with open('E:/000.txt','r')as f:
... for line in f:
... seg = jieba.cut(line.strip(),cut_all = False)
... output = '/'.join(seg)
... output