编码
luoye7422
这个作者很懒,什么都没留下…
展开
-
解决python ConfigParser文件编码问题(按指定格式存储文件(txt))
解决python ConfigParser文件编码问题(按指定格式存储文件(txt))配置文件编码为UTF-8,内容如下:[section1]p1=中文字符串 如果用 config.readfp(open('cfg.ini')),会出现乱码问题因为open函数不能指定编码,所以改用codecs.open,指定编码为 utf-8,在eclipse pydev下测试转载 2014-12-17 00:10:23 · 2362 阅读 · 0 评论 -
《UTF-8与GB2312之间的互换》的改进
《UTF-8与GB2312之间的互换》的改进下载源代码 最近,在做一个小程序的时候,突然遇到了汉字编码转换问题。关于如何在UTF-8与GB2312之间转换的问题。在VC知识库里看到吴康彬的文章《UTF-8与GB2312之间的互换》,文章浅显易懂,代码也不长。省了我不少的找资料的时间。在此谢谢了。 :) 在看代码的过程中,吴康彬用了许多字符串的转换,来进行2进制的运算转载 2014-12-16 23:22:03 · 394 阅读 · 0 评论 -
Ansi、Unicode、UTF8字符串之间的转换和写入文本文件
Ansi、Unicode、UTF8字符串之间的转换和写入文本文件转载请注明出处http://www.cppblog.com/greatws/archive/2008/08/31/60546.html最近有人问我关于这个的问题,就此写一篇blogAnsi字符串我们最熟悉,英文占一个字节,汉字2个字节,以一个\0结尾,常用于txt文本文件Unicode字符串,每个字符(汉字转载 2014-12-16 23:23:32 · 317 阅读 · 0 评论 -
字符串处理 - ANSI - Unicode - UTF8 转换
字符串处理 - ANSI - Unicode - UTF8 转换[C语言]字符串处理 - ANSI - Unicode - UTF8 转换2008-11-4: 使用MultiByteToWideChar和WideCharToMultiByte写的4个ANSI Unicode UTF-8 相互转换的函数。2008-11-5: 使用C语言标准库mbstowcs和wc转载 2014-12-16 23:30:13 · 356 阅读 · 0 评论 -
Ansi、Unicode、UTF8字符串之间的转换和写入文本文件
Ansi、Unicode、UTF8字符串之间的转换和写入文本文件Ansi、Unicode、UTF8字符串之间的转换和写入文本文件 转载请注明出处http://www.cppblog.com/greatws/archive/2008/08/31/60546.html最近有人问我关于这个的问题,就此写一篇blogAnsi字符串我们最熟悉,英文占一个字节,汉字2个字节,以一个\0结尾,常转载 2014-12-16 23:31:37 · 302 阅读 · 0 评论 -
字符编码详解及由来(UNICODE,UTF-8,GBK)
字符编码详解及由来(UNICODE,UTF-8,GBK)各种字符编码方式详解及由来(ANSI,UNICODE,UTF-8,GB2312,GBK) -2009-01-29 09:53 一直对字符的各种编码方式懵懵懂懂,什么ANSI、UNICODE、UTF-8、GB2312、GBK、DBCS、UCS……是不是看的很晕,假如您细细的阅读本文你一定可以清晰的理解他们。Let's go!转载 2014-12-16 23:39:34 · 373 阅读 · 0 评论 -
字符编码(理论篇)
0. 从ASCII码说起学过电脑的人都听说过ASCII码,这是一种根据英文字符表设计的字符编码。严格意义上来讲,标准ASCII码只有7位(最高位为0),共128个字符,用十进制表示是:0-127。其中0-31和127为控制字符,而32-126为显示字符。国际标准化组织还发布了一些8位ASCII码扩展字符集,其中最流行的就是ISO 8859-1 (ISO Latin1)。它除了兼容标准的7位转载 2014-12-16 23:40:49 · 751 阅读 · 0 评论 -
ASCII、ANSI、UNICODE及UTF-8编码
ASCII、ANSI、UNICODE及UTF-8编码今天用notepad.exe另存文本文件的时候,发现下面的编码中,有个ANSI编码,文章题目中的几个编码在解决B/S程序乱码问题的时候,基本都了解了,但ANSI是什么东东?原来...... 1. ASCII和Ansi编码 字符内码(charcter code)指的是用来代表字符的内码.读者在输入和存储文档时都要使用内转载 2014-12-16 23:41:28 · 271 阅读 · 0 评论 -
字符集编码
字符集编码字符集编码详解字符是各种文字和符号的总称,包括各国家文字、标点符号、图形符号、数字等。字符集是多个字符的集合,字符集种类较多,每个字符集包含的字符个数不同,常见字符集名称:ASCII字符集、GB2312字符集、BIG5字符集、 GB 18030字符集、Unicode字符集等。计算机要准确的处理各种字符集文字,需要进行字符编码,以便计算机能够识别和存储各种文字。转载 2014-12-16 23:51:58 · 686 阅读 · 0 评论 -
UTF-8与GB2312之间的互换
UTF-8与GB2312之间的互换 相信一定有不少的程序开发人员时常会遇到字符编码的问题,而这个问题也是非常让人头痛的。因为这些都是潜在的错误,要找出这些错误也得要有这方面的开发经验才行。特别是在处理xml文档时 ,该问题的出现就更加的频繁了,有一次用java写服务器端程序,用vc写客户端与之交互。交互的协议都是用xml写的。结果在通讯时老是发现数据接受不正确。纳闷!于是用抓取网转载 2014-12-16 23:20:03 · 844 阅读 · 0 评论 -
Python 将 HTML 文件转成指定的编码
Python 将 HTML 文件转成指定的编码importsysimportchilkat charset=chilkat.CkCharset() # Any string argument automatically begins the 30-day trial.success=转载 2014-12-17 00:34:04 · 632 阅读 · 0 评论 -
Python 处理各种编码的字符串
# file: Unicode2.py# -*- coding: utf-8 -*- importchilkat # The CkString object can handle any character encoding.s1=chilkat.CkString()# The appendEnc met转载 2014-12-17 00:27:35 · 378 阅读 · 0 评论 -
Python 加载二进制文件到 CkByteArray 对象
Python 加载二进制文件到 CkByteArray 对象importchilkat zipData=chilkat.CkByteData() success=zipData.loadFile("dude.zip")if(success !=True): print转载 2014-12-17 00:31:15 · 415 阅读 · 0 评论 -
Python3批量转换文本文件编码
Python3批量转换文本文件编码-*- coding: utf-8 -*-002try:003 from chardet.universaldetector import UniversalDetector004 IsAuto = True转载 2014-12-17 00:43:03 · 487 阅读 · 0 评论 -
unicode编码
unicode编码 每一种语言的不同的编码页,增加了那些需要支持不同语言的软件的复杂度。因而人们制定了一个世界标准,叫做unicode(http://www.unicode.org).Unicode为每个字符提供了唯一的特定数值,不论在什么平台上、不论在什么软件中,也不论什么语言。也就是说,它世界上使用的所有字符都列出来,并给每一个字符一个唯一特定数值。什么是UTF-8?它转载 2014-12-16 23:32:19 · 371 阅读 · 0 评论 -
PEP 263 Implementation
classificationTitle:PEP 263 ImplementationType: Stage: Components:Interpreter CoreVersions:Python 2.3processStatus:c转载 2014-12-16 23:56:53 · 762 阅读 · 0 评论 -
python读写不同编码txt文件
python读写不同编码txt文件以后整理规范[python] view plaincopyimport os import codecs filenames=os.listdir(os.getcwd()) out=file("name.txt","w") for filename in fil转载 2014-12-16 23:58:41 · 422 阅读 · 0 评论 -
python编码问题总结
python编码问题总结编码Python核心发布中的代码必须始终使用ASCII或Latin-1编码(又名 ISO-8859-1),使用ASCII的文件不必有编码cookie,Latin-1仅当注释或文档字符串涉及作者名字需要Latin-1时才被使用:另外使用\x转义字符是在字符串中包含非ASCII(non-ASCII)数据的首选方法。作为PEP 263实现代码的转载 2014-12-17 00:03:35 · 409 阅读 · 0 评论 -
批量修改文本文件编码GB18030为UTF-8
批量修改文本文件编码GB18030为UTF-8[root@localhost Desktop]# ./digui-gb18030-utf8.sh experimentdigui-gb18030-utf8.sh 文件内容如下:#!/bin/sheachd() { for chkfile in $1/* do转载 2014-12-17 00:13:09 · 1586 阅读 · 0 评论 -
unicode和MBCS(多字节字符集)的关系
unicode和MBCS(多字节字符集)的关系多了,先转载过来,供大家分享。转载地址:http://my.oschina.net/alphajay/blog/5691***********************************************************************************************************转载 2014-12-16 23:52:56 · 93408 阅读 · 0 评论 -
Python 对文件进行编码转换
Python 对文件进行编码转换importsysimportchilkat charset=chilkat.CkCharset() # Any string argument automatically begins the 30-day trial.success=char转载 2014-12-17 00:20:38 · 692 阅读 · 0 评论 -
Python 字符编码
Python 字符编码#coding=utf-8 importsys printsys.getdefaultencoding() # --> ascii u1='中国' printtype(u1),repr(u1) # --> '\x转载 2014-12-17 00:34:51 · 336 阅读 · 0 评论 -
通过 Python 装饰器实现DRY(不重复代码)原则
通过 Python 装饰器实现DRY(不重复代码)原则英文原文:DRY Principles through Python DecoratorsPython装饰器是一个消除冗余的强大工具。随着将功能模块化为大小合适的方法,即使是最复杂的工作流,装饰器也能使它变成简洁的功能。例如让我们看看Django web框架,该框架转载 2014-12-23 22:42:28 · 692 阅读 · 0 评论 -
Python 开发工具集:关于文档、测试、调试、程序的优化和分析
Python 开发工具集:关于文档、测试、调试、程序的优化和分析原文 http://segmentfault.com/a/1190000000410521Python已经演化出了一个广泛的生态系统,该生态系统能够让Python程序员的生活变得更加简单,减少他们重复造轮的工作。同样的理念也适用于工具开发者的工作,即便他们开发出的工具并没有出现在最终的程序中。本文将介绍Python程转载 2014-12-23 22:44:48 · 686 阅读 · 0 评论 -
通过 Python 装饰器实现DRY(不重复代码)原
通过 Python 装饰器实现DRY(不重复代码)原Python装饰器是一个消除冗余的强大工具。随着将功能模块化为大小合适的方法,即使是最复杂的工作流,装饰器也能使它变成简洁的功能。例如让我们看看Django web框架,该框架处理请求的方法接收一个方法对象,返回一个响应对象:def handle_request(request): return HttpR转载 2014-12-23 22:53:32 · 481 阅读 · 0 评论 -
Python 程序员必知必会的开发者工具
Python 程序员必知必会的开发者工具 Python已经演化出了一个广泛的生态系统,该生态系统能够让Python程序员的生活变得更加简单,减少他们重复造轮的工作。同样的理念也适用于工具开发者的工作,即便他们开发出的工具并没有出现在最终的程序中。本文将介绍Python程序员必知必会的开发者工具。 对于开发者来说,最实用的帮助莫过于帮助他们编写代码文档了。pydoc模块可以根据源代码转载 2014-12-23 22:54:36 · 505 阅读 · 0 评论 -
用Python实现应用Last-Modified和ETag避免下载重复内容
用Python实现应用Last-Modified和ETag避免下载重复内容Http 1.1中避免重复下载的标记使用Http1.1中定义好的头信息来避免重复下载,参考HTTP/1.1 Section 14 Header Field Definitions中的14.19 ETag/14.24 If-Match/14.29 Last-Modified/14.25 If-Modif转载 2014-12-23 22:55:28 · 1591 阅读 · 0 评论 -
《Python学习手册》读书笔记
《Python学习手册》读书笔记 之前为了编写一个svm分词的程序而简单学了下Python,觉得Python很好用,想深入并系统学习一下,了解一些机制,因此开始阅读《Python学习手册(第三版)》。如果只是想快速入门,我在这里推荐了几篇文章,有其他语言编程经验的人简单看一看就可以很快地开始编写Python程序了。 黑体表示章节, 下划线表示可以直接在原文对应位置查到的专有技术名词转载 2015-01-20 21:21:14 · 658 阅读 · 0 评论 -
追求代码质量: 不要被覆盖报告所迷惑
追求代码质量: 不要被覆盖报告所迷惑您是否曾被测试覆盖度量引入歧途?测试覆盖工具对单元测试具有重要的意义,但是经常被误用。这个月,Andrew Glover 会在他的新系列 —— 追求代码质量 中向您介绍值得参考的专家意见。第一部分深入地介绍覆盖报告中数字的真实含义。然后他会提出您可以尽早并经常地利用覆盖来确保代码质量的三个方法。转载 2014-12-23 22:40:31 · 546 阅读 · 0 评论 -
追求代码质量: 监视圈复杂度
追求代码质量: 监视圈复杂度当代码复杂度超出想像时该如何做如果复杂度与缺陷紧密相关,那么监视代码库的复杂度值不是很有意义吗?Andrew Glover 将展示如何使用简单的代码度量工具和基于 Java™ 的工具来监视圈复杂度 (cyclomatic complexity)每位开发人员对代码质量的含义都有着自己的看法,并转载 2014-12-23 22:22:42 · 1156 阅读 · 0 评论 -
Python3批量转换文本文件编码
Python3批量转换文本文件编码#-*- coding: utf-8 -*-try: from chardet.universaldetector import UniversalDetector IsAuto = Trueexcept ImportError: IsAuto = Falseimport osimport os.pathimport globdef转载 2014-12-17 00:45:48 · 707 阅读 · 0 评论 -
python实现批量转换文件编码(批转换编码示例)
这篇文章主要介绍了python实现批量转换文件编码示例,指定文件编码、目录或扩展名即可进行转换,大家参考使用吧# -*- coding:utf-8 -*-__author__ = 'walkskyer'import osimport globclass Encoding: def __init__(self): #文件扩展名转载 2014-12-17 01:03:15 · 468 阅读 · 0 评论 -
使用windows命令和iconv.exe批量转换文件编码
使用windows命令和iconv.exe批量转换文件编码 iconv是知名的开源跨平台编码转换库,iconv.exe是iconv库在windows下的命令行工具,iconv.exe的一般用法:iconv.exe -f gbk -t utf-8 gbk.txt > utf-8.txt。其中 -f gbk 指明转换前的文件编码是gbk,-t utf-8 指明转换后的文件编码是utf-8,gb转载 2014-12-22 23:20:30 · 1991 阅读 · 0 评论 -
ToolBox系列工具之Detector
ToolBox系列工具之Detector1.用Kindle原版系统的童鞋会知道,国内的txt大部分都是gb2312编码,在Kindle上识别不是太好,一些文本编辑工具,比如Notepad++,也可以转换文本文件格式,但是只能一个一个转换不太方便。有了toolbox_detector,就方便多了,把所有要转换的文件放在一起,一下子全部就转换成需要的格式了,很方便。2.编译过网上开源代码的童鞋转载 2014-12-22 21:32:14 · 649 阅读 · 0 评论 -
使用iconv命令轻松实现linux下字符集编码的转换
使用iconv命令轻松实现linux下字符集编码的转换昨天晚上郎师兄打电话说,我的结果文件他打开是乱码,问我是不是字符编码没处理好。早晨早早的来到实验室,请教了下同学,才知道linux shell 配置文件中默认的字符集编码为UTF-8 。UTF-8是unicode的一种表达方式,gb2312是和unicode都是字符的编码方式,所以说gb2312跟utf-8的概念应该不是一个层次上的。在转载 2014-12-22 21:34:16 · 401 阅读 · 0 评论 -
使用 windows命令和iconv.exe批量转换文件编码
使用 windows命令和iconv.exe批量转换文件编码 iconv是知名的开源跨平台编码转换库,iconv.exe是iconv库在windows下的命令行工具,iconv.exe的一般用法:iconv.exe -f gbk -t utf-8 gbk.txt >转载 2014-12-22 23:21:34 · 3103 阅读 · 0 评论 -
用 Python 编写干净、可测试、高质量的代码
用 Python 编写干净、可测试、高质量的代码用任何语言都可以写出极其糟糕的代码,包括优雅强大的 Python 语言。在本文中,我们讨论看待测试的方式不同如何导致差异很大的 Python 代码。最后,讨论如何科学地度量代码差异。编写软件是人所承担的最复杂的任务之一。AWK 编程语言和 "K and R C" 的作者之一 Brian Kernigan 在 Software To转载 2014-12-22 23:25:53 · 1257 阅读 · 0 评论 -
Python代码分析工具:PyChecker、Pylint
1 概述PyChecker是Python代码的静态分析工具,它能够帮助查找Python代码的bug,而且能够对代码的复杂度和格式等提出警告。PyChecker可以工作在多种方式之下。首先,PyChecker会导入所检查文件中包含的模块,检查导入是否正确,同时检查文件中的函数、类和方法等。PyChecker可以检查出来的问题有如下几种:全局量没有找到,比如没有导入模块传递给函数、转载 2014-12-23 22:20:39 · 705 阅读 · 0 评论 -
c++ ANSI、UNICODE、UTF8互转
c++ ANSI、UNICODE、UTF8互转 static std::wstring MBytesToWString(const char* lpcszString); static std::string WStringToMBytes(const wchar_t* lpwcszWString); static std::wstring UTF8ToWSt转载 2014-12-16 23:17:02 · 456 阅读 · 0 评论 -
一个批量转换文本文件编码的程序(Python)
一个批量转换文本文件编码的程序(Python)#!/usr/bin/python import os,sys def convert( filename, in_enc = "GBK", out_enc="UTF-8" ): # read the file fp = open( filename ) content = f转载 2014-12-17 00:40:26 · 488 阅读 · 0 评论