字符集
文章平均质量分 78
yanwenyuan0102
这个作者很懒,什么都没留下…
展开
-
Unicode 汉字内码表
啊:21834 阿:38463 埃:22467 挨:25384 哎:21710 唉:21769 哀:21696 皑:30353 癌:30284 蔼:34108 矮:30702 艾:33406 碍:30861 爱:29233 隘:38552 鞍:38797 氨:27688 安:23433 俺:20474 按:25353 暗:26263 岸:23736 胺:33018 案:26696 肮:32942转载 2006-08-28 15:24:00 · 75307 阅读 · 0 评论 -
从 GB2312 到 Unicode 转换表制作程式(JAVA)
/** * GB2312Unicde.java * Copyright (c) 1997-2003 by Dr. Herong Yang */import java.io.*;import java.nio.*;import java.nio.charset.*;class GB2312Unicde { static OutputStream out = null; static char转载 2006-08-28 16:12:00 · 1244 阅读 · 0 评论 -
谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题:问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢?我很早前就发现Uni转载 2006-08-29 14:05:00 · 673 阅读 · 0 评论 -
用API 作简繁体转换
1. 输入Big5字符,返回Gb简体字符 //--------------------------------------------------------------------------- //函数输入Big5字符,返回Gb简体字符 //--------------------------------------------------------------------转载 2006-08-28 19:48:00 · 840 阅读 · 0 评论 -
GB2312-80区位编码表
(以下第01—09区为国标符号,第10-15区为空区) 国标第01区 0 1 2 3 4 5 6 7 8 9 0 、 。 ·转载 2006-08-28 19:53:00 · 15419 阅读 · 0 评论 -
对UTF8编码的初步认识!
在网络中有很多地方都有采用UTF8编码,由于要编写与邮件服务端有关的程序,而邮件服务端有些地方用到了UTF8编码,所以对它有了初步的认识!它其实和Unicode是同类,就是在编码方式上不同!首先UTF8编码后的大小是不一定,不像Unicode编码后的大小是一样的!我们先来看Unicode的编码:一个英文字母 “a” 和 一个汉字 “好”,编码后都是占转载 2006-08-29 11:18:00 · 779 阅读 · 0 评论