python
文章平均质量分 83
yixiaojie
dfsadecadsca
展开
-
python判断unicode是否是汉字,数字,英文,或者其他字符
下面这个小工具包含了 判断unicode是否是汉字,数字,英文,或者其他字符。 全角符号转半角符号。 unicode字符串归一化等工作。 #!/usr/bin/env python # -*- coding:GBK -*- """汉字处理的工具: 判断unicode是否是汉字,数字,英文,或者其他字符。 全角符号转半角符号。""" def翻译 2015-01-17 14:57:08 · 4560 阅读 · 0 评论 -
Python之迭代器(iterator)
迭代器(iterator) 一个表示数据流的对象。反复调用迭代器的__next__()方法(或给它传递内建函数(built-in function)next())来返回在该流中的后继项。当没有可用数据时,产生一个StopInteration异常。此时,迭代器对象被耗尽,之后再调用__next__()方法只会再次产生StopInteration异常。迭代器要求包含一个__iter__()方法,翻译 2015-01-20 20:15:57 · 989 阅读 · 0 评论 -
pickle和cPickle:Python对象的序列化
目的:Python对象序列化 可用性:pickle至少1.4版本,cPickle 1.5版本以上 pickle模块实现了一种算法,将任意一个Python对象转化成一系列字节(byets)。此过程也调用了serializing对象。代表对象的字节流之后可以被传输或存储,再重构后创建一个拥有相同特征(the same characteristics)的新的对象。 cPickle使原创 2015-01-21 19:32:42 · 856 阅读 · 0 评论 -
在Python中正确使用Unicode
正确处理文本,特别是正确处理Unicode。是个老生常谈的问题,有时甚至会难倒经验丰富的开发者。并不是因为这个问题很难,而是因为对软件中的文本,开发者没有正确理解一些关键概念及其表示方法。在StackOverflow上搜索关于UnicodeDecodeError相关的问题,可以看到很多人都有这样的误解。这些错误的概念可以追溯到Unicode出现之前。那时许多现今的开发者还没入职,也包括我自己。如果原创 2015-01-22 18:56:36 · 1493 阅读 · 1 评论