python数据清理——将excel单元格的内容写入到txt

本文介绍如何使用Python处理Excel文件,将某一列内容复制到TXT文件,并按照行分隔符拆分为多个单独的TXT文件。通过正则表达式和文件操作,实现了数据清理和文本处理的自动化。
摘要由CSDN通过智能技术生成

问题描述:目前有exlce文件中包含大量文字信息,为了后续文本处理分析。需要将每个exlce的单元格,生产一个txt文件。

第一步:将excle某列选中,全部copy到txt文件中。则会形成带有空行\n的txt文件格式。如下图


第二步:将txt文件,切分成若干个小文件txt。以\n 为区分。python实现代码如下。部分也参考http://blog.csdn.net/laoyaotask/article/details/46797717

#*****************************************************#
# -*- coding:utf8 -*- 
# 专利标题title文件切分:从1开始分
import re;
p=re.compile('\n',re.S);
fileContent=open('/Users/1-4000.txt','r').read();#读文件内容,
paraList=p.split(fileContent) #根据换行符对文本进行切片

fileWriter=open('/Users/0.txt','a');#创建一个写第一个文件
for paraIndex in range(len(paraList)):#遍历切片后的文本列表
    fileWriter

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值