Python实现txt文件内容快速合并功能

残枫逝痕

于 2011-11-29 16:36:02 发布

阅读量5.3k

点赞数 1

分类专栏： Python-items 文章标签： python encoding 脚本工具 file import

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jinmmd/article/details/7024045

版权

这段时间三天两头断电断网的，真是背到家了，明后两天寝室楼更是要因为线路改造要从早上7点停到晚上5点半，真是悲剧。

今天汇编的时候在阿甘的博客里面看到了一部小说《疯狂的程序员》，于是网上搜了下准备放到手机里闲时看看，无奈下载后发现是分章节的txt文本，一共有87个文件，考虑到阅读起来不是很方便，于是想找个现成的工具合并txt文本。

结果尝试了几个工具后觉得合并效果都不给力啊，于是打算自己动手。其实cmd的命令"type *.txt >> crazy-programmer.txt"还是很有效果的，然而合并后的txt文件却十分庞大，所以我还是自己写了一个脚本完成了合并。

说明：由于我下载的87个txt文件的字符编码格式都不统一，所以我用chardet模块判断字符编码类型后再用codecs模块的codecs.open功能解决了编码问题。如果直接用file的open打开txt文件的话，在UCS-2 Little Endian的编码情况下，file.read()遇到中文的冒号(即“：”)后会无法读取冒号以后的内容，所以需要用codecs.open(path,'r',encoding)来解决。

如果还有问题可以留言，代码如下：

#!coding: cp936
import codecs, ch

最低0.47元/天解锁文章

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
2
评论
Python实现txt文件内容快速合并功能

这段时间三天两头断电断网的，真是背到家了，明后两天寝室楼更是要因为线路改造要从早上7点停到晚上5点半，真是悲剧。今天汇编的时候在阿甘的博客里面看到了一部小说《疯狂的程序员》，于是网上搜了下准备放到手机里闲时看看，无奈下载后发现是分章节的txt文本，一共有87个文件，考虑到阅读起来不是很方便，于是想找个现成的工具合并txt文本。结果尝试了几个工具后觉得合并效果都不给力啊，于是打算自己动手。其
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。