自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

转载 将搜狗词库.scel格式转化为.txt格式

#!/bin/python# -*- coding: utf-8 -*-import structimport sysimport binasciiimport pdbtry:    reload(sys)    sys.setdefaultencoding('utf-8')except:    pass# 搜狗的scel词库就是保存的文本的unicode编码,每两个字节一个字符(中文汉字或者英文...

2018-03-15 16:56:01 805

原创 python数据清理——将excel单元格的内容写入到txt

问题描述:目前有exlce文件中包含大量文字信息,为了后续文本处理分析。需要将每个exlce的单元格,生产一个txt文件。第一步:将excle某列选中,全部copy到txt文件中。则会形成带有空行\n的txt文件格式。如下图第二步:将txt文件,切分成若干个小文件txt。以\n 为区分。python实现代码如下。部分也参考http://blog.csdn.net/laoyaotas

2018-01-23 14:43:37 1605

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除