当复制VS2010中带有中文字符的代码到Office(Word, Excel, PowerPoint, Outlook)时,
在中文字符后面会被添加一到三个乱码。比如复制"中文字符",粘贴到word就会变成(中D文?字Á?符¤?)。
通过黑暗执行绪的一篇文章提示,截取剪贴板中RTF(富文本格式)的数据流,并作出修复。该作者使用了 .NET中的正则表达式类RegEx来达到修复目的。方法调用很简单,感兴趣的可以搜索一下作者的博客空间。
我这里给出另一个解决方法:同时截取CF_UNICODETEXT和RTF两种剪贴板数据,以CF_UNICODETEXT中的正确数据为参照,对比剔除RTF中的乱码。
写这份代码走了不少弯路,主要是一开始对RTF格式不熟悉,其中的中文接ASCII码处理着实让我差点抓破了头皮。
先给出乱码修复截图:
程序添加了全局热键 CTRL+Q 和 监测状态。右下角则是一个动态文字Logo,鼠标移上去就会出现Logo,
移开则改为快捷键说明。编译好的文件这里下载VS2010CopyModify.rar。
如果需要所有源文件,可以在我的资源空间下载VS2010CopyModify源文件。
下面贴出程序的核心算法:
函数参数说明:
PTSTR pText (RTF数据首地址指针,切勿传递剪贴板内存,必须是程序拷贝剪贴板的。)
UINT iText (RTF数据大小。单位字节)
LPWSTR pTextU (CF_UNICODETEXT数据首地址指针,同上,不可为剪贴板内存。)
UINT iTextU (CF_UNICODETEXT数据大小。单位字符)
返回值类型 UINT (修复完后RTF数据的大小。单位字节)
Repair.cpp - 实作乱码修正处理
-------------------------------*/
#include <windows.h>
#include <string.h>
UINT ClobalRepair ( PTSTR pText , UINT iText , LPWSTR pTextU , UINT iTextU)
{
const PTSTR tZ = " // uinput2 // u" ,
tA = " // cf0 // par" ,
tP = " // par";
TCHAR AnsiT [ 11 ];
PTSTR pTextS = pText ,
pTextW = NULL ,
pAnsiT = AnsiT;
PTCHAR pTextK = NULL;
UINT i , iU , iC = 0 , iR = 0 ,
UTRange = 10;
BOOL bAnsi = FALSE;
LPWSTR pTextUW = pTextU;
long int iM;
while( TRUE)
{
// 查找/uinput2/u
pTextS = strstr( pTextS , tZ);
if( pTextS == NULL)
break;
// 指向Unicode编码的首字节
pTextS = & pTextS [ UTRange ];
// 获取Unicode编码的十六进制值
iM = strtol( pTextS , & pTextK , 10);
// 修正负数补码的问题
iM = iM & 0xFFFF;
pTextS = pTextK;
pTextS = & pTextS [ 1 ];
pTextS [ 0 ] = ' ';
pTextS = & pTextS [ 1 ];
// 在Unicode数据中对焦中文字符
for ( iU = 0; iU < iTextU; iU ++)
{
if( pTextUW [ iU ] == iM)
{
pTextUW = & pTextUW [ iU + 1 ];
iTextU -= ( iU + 1);
break;
}
}
// 中文接中文的处理
if ( pTextUW [ 0 ] > 0x80)
{
pTextW = strstr( pTextS , tZ);
iC = pTextW - pTextS;
i = pTextS - pText;
iR = i + iC;
for ( i = 0; iR <= iText; i ++ , iR ++)
pTextS [ i ] = pTextW [ i ];
iText -= iC;
continue;
}
// 文档尾的处理
if( pTextUW [ 0 ] == NULL)
{
pTextW = strstr( pTextS , tP);
iC = pTextW - pTextS;
i = pTextS - pText;
iR = i + iC;
for ( i = 0; iR <= iText; i ++ , iR ++)
pTextS [ i ] = pTextW [ i ];
iText -= iC;
continue;
}
// 换行符、回车及水平制表
if (