- 博客(4)
- 收藏
- 关注
转载 谈谈Unicode编码,简要解释UCS、UTF、BMP、BOM等名词
这是一篇程序员写给程序员的趣味读物。所谓趣味是指可以比较轻松地了解一些原来不清楚的概念,增进知识,类似于打RPG游戏的升级。整理这篇文章的动机是两个问题: 问题一: 使用Windows记事本的“另存为”,可以在GBK、Unicode、Unicode big endian和UTF-8这几种编码方式间相互转换。同样是txt文件,Windows是怎样识别编码方式的呢? 我很早前就发现
2007-07-30 17:57:00 434
转载 关于UTF-8编码
关于UTF-8编码2006-11-28 19:03我一直在想,不知道有哪个国家像中国一样,拥有“简体”“繁体”两种字体!“简体中文”有其笔画简洁易于书写的好处,“繁体中文”有其蕴义丰富,方形饱满的美感,都各有千秋!可是一个国家两种字体真让人哭笑不得,大陆地区全部用改革后的中文字“简体中文”,而港、澳、台地区却保留使用未简化的中文,称之为繁体中文。当然,形成这种尴尬的局面有其政治历史的原因,
2007-07-30 16:56:00 607
转载 网络爬虫技术介绍
网络爬虫技术介绍随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista,百度,Yahoo!和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。但是,这些通用性搜索引擎也存在着一定的局限性,如: (1) 不同领域、不同背景的用户往往具有不
2007-06-20 16:42:00 2101 1
转载 初学linux
开始学liux了,呵呵,一定要坚持啊!基本命令一、遍历目录1、pwd 显示当前目录 2、cd 从起始目录到达指定的目录3、cd 回到起始目录3、cd / 回到根目录二、查看目录内容:1、ls 查看当前目
2007-06-19 15:32:00 515
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人