问题描述:目前有exlce文件中包含大量文字信息,为了后续文本处理分析。需要将每个exlce的单元格,生产一个txt文件。
第一步:将excle某列选中,全部copy到txt文件中。则会形成带有空行\n的txt文件格式。如下图
第二步:将txt文件,切分成若干个小文件txt。以\n 为区分。python实现代码如下。部分也参考http://blog.csdn.net/laoyaotask/article/details/46797717
#*****************************************************#
# -*- coding:utf8 -*-
# 专利标题title文件切分:从1开始分
import re;
p=re.compile('\n',re.S);
fileContent=open('/Users/1-4000.txt','r').read();#读文件内容,
paraList=p.split(fileContent) #根据换行符对文本进行切片
fileWriter=open('/Users/0.txt','a');#创建一个写第一个文件
for paraIndex in range(len(paraList)):#遍历切片后的文本列表
fileWriter