自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Harry的专栏

专注于Deep Learning, MT, NLP,能力是一种态度

  • 博客(6)
  • 资源 (1)
  • 论坛 (30)

原创 CFile在写入Unicode编码文件出现乱码---原因及解决办法

<br /><br />      这几天统计一个词典,为藏文词典,以Unicode编码保存。要对其进行过滤处理,并且要保存处理后的结果。<br />      在一开始出现了一下问题:<br />     1,把源文件读到程序中,重新写回去,没问题<br />     2,在对原文件处理后,重新写回去,出现乱码<br />      原来,在程序处理时,把Unicode文件的头标志,过滤掉了。这样,写入的文件虽然是Unicode文件,但是,没有头标志,程序没法判断文件编码,只有按默认的ANSI编码读取。这

2011-04-21 19:26:00 4228

转载 转发一篇关于ANSI,Unicode,UTF-8编码的文章,我认为是最容易动的,最详细的

<br /><br />很久很久以前,有一群人,他们决定用8个可以开合的晶体管来组合成不同的状态,以表示世界上的万物。他们看到8个开关状态是好的,于是他们把这称为"字节"。<br />再后来,他们又做了一些可以处理这些字节的机器,机器开动了,可以用字节来组合出很多状态,状态开始变来变去。他们看到这样是好的,于是它们就这机器称为"计算机"。<br />开始计算机只在美国用。八位的字节一共可以组合出256(2的8次方)种不同的状态。<br />他们把其中的编号从0开始的32种状态分别规定了特殊的用途,一但终端、

2011-04-15 15:31:00 1145 1

原创 写入Excel的类,充分考虑了各种异常,

这几天要对一些数据格式为Excel表格的词典文进行统计,并且一些过滤。本来并不太复杂的事,由于操作Excel的关系,浪费了很长时间,下定决心要写一个操作Excel表格的类,方便以后重用。下面为代码:要添加.NET引用“using Microsoft.Office.Interop.Excel”,和对应的COM引用“Microsoft Excel 11.0 Object Library”

2011-04-10 16:47:00 985

原创 Linux C 格式化输出时要注意的问题

<br />在Linux下提供了以下函数提供格式化输出,printf,fprintf,sprintf,snprintf。这些函数的头文件定义都是stdio.h。为标准的C库函数。<br />    printf提供标准的输出流,fprintf往特定的流中写数据。前者比较常见,用的也较多。<br />    sprintf格式化输入到字符指针缓冲,这个函数自动的加入null byte到缓冲,但是返回值不包括这个结束字节。<br />    使用sprintf函数意缓冲溢出问题,用户要保证格式化数据

2011-04-09 20:34:00 2440 2

原创 Unix网络字节顺序及其判断

一            对于一个16字节的数据,比如0x0102,在内存中可以有两个方式来存贮。一种是0x0102,一种是0x0201,前者成为小段对其,后者成为大端对齐。      在网络编程中,需要考虑到网络数据的存储顺序问题,这是个很重要的问题。因为客户机的数据存储顺是不统一好的,比如Linux,Windows用的是小段对齐,BSD,AIX等Unix系统用的时大端对齐。如果要在不同容的许同上交换数据就必须考虑这个数据格式的问题。     在Linux/Unix中,通常的数据在堆中存储

2011-04-08 16:41:00 1532

原创 一个用C#写得读Excel表格的类,效率高,可重用

using System;using System.Collections.Generic;using System.Linq;using System.Text;using System.Data;using System.Data.OleDb;using System.IO;namespace MyExcel{ public class MyExcelReader { /// /// Access 数据库连接字符串

2011-04-04 11:13:00 4056

makefile 用法--最全的教程--pdf格式

makefile 用法--最全的教程--pdf格式

2010-10-27

100分提问:C++中string中包含中文和英文以及其他文字,怎么可以分出中文字符和英文字符

发表于 2011-01-12 最后回复 2017-12-29

从码农晋升为大学老师---散分求祝福

发表于 2013-04-18 最后回复 2013-05-01

关于发布标准C++程序问题

发表于 2012-07-09 最后回复 2013-04-18

加入码农届还是做个大学老师?

发表于 2012-12-08 最后回复 2013-02-27

散分,放松一下,问个轻松地问题

发表于 2011-02-18 最后回复 2012-11-23

在实际的企业级Linux C/C++开发中大家用什么工具:40分

发表于 2010-11-09 最后回复 2012-11-23

从事[自然语言处理,NLP]年薪过30W,不是梦

发表于 2012-07-04 最后回复 2012-10-10

【小调查】懂得或者是从事[自然语言处理,NLP]的同行们报个到

发表于 2012-06-29 最后回复 2012-10-10

c++字符串赋值问题

发表于 2012-07-07 最后回复 2012-07-07

年薪30万是怎样炼成的

发表于 2012-07-01 最后回复 2012-07-04

【小调查】从事机器翻译研究的ITer们,交流一下吧

发表于 2012-06-30 最后回复 2012-07-01

今天,天气不错

发表于 2012-04-14 最后回复 2012-06-29

100分求助个好用的网络爬虫,只要能下载网页就行

发表于 2011-12-23 最后回复 2011-12-26

100分求助,想用个比较好用的爬虫,只要能下载网页就行,请各位大侠多多分享

发表于 2011-12-21 最后回复 2011-12-21

到了北京,第一次来,新的环境,新的开始!!!

发表于 2011-09-15 最后回复 2011-09-19

庆祝博客访问突破10000万次,专家分突破1000分,散分啊,谢谢大家

发表于 2011-08-15 最后回复 2011-08-19

一个女孩说:见到我比较紧张,啥意思,大家速度快点回复,谢谢

发表于 2011-07-02 最后回复 2011-07-03

今晚约会-散分攒人品-100分

发表于 2011-07-01 最后回复 2011-07-02

技术分达到1000分,散分,祝福各位

发表于 2011-05-19 最后回复 2011-05-21

五一散分100给各为CPPer

发表于 2011-04-30 最后回复 2011-05-02

五一散分100给各位Linuxer

发表于 2011-04-30 最后回复 2011-05-01

100分,求助,C++读取unicode编码文件读取问题,解决着60分,顶着有份

发表于 2011-04-15 最后回复 2011-04-15

散分100:22号就要回家了,提前祝福各位CSDNer,2011要给力啊

发表于 2011-01-20 最后回复 2011-01-21

CSDN中博客文章分类中“评论”是什么意思:一天后结贴

发表于 2011-01-07 最后回复 2011-01-08

散分---结束2010,祝福各位2011心想事成。

发表于 2010-12-31 最后回复 2011-01-02

大学四年-纪念最亲的人:外婆-快毕业时的反思-我的真实经历

发表于 2010-12-28 最后回复 2010-12-28

40分求助C#队列问题

发表于 2010-04-15 最后回复 2010-10-29

过几天要考研复试了,望上帝保佑,散分祝福所有人。

发表于 2010-03-31 最后回复 2010-04-12

在C#.net 面前,C++有前途吗?

发表于 2010-03-29 最后回复 2010-03-30

差一分-----注定地?

发表于 2010-03-28 最后回复 2010-03-29

空空如也
提示
确定要删除当前文章?
取消 删除