TXT导入MSSQL 生僻字解决

原创 2007年09月27日 16:45:00

TXT导入MSSQL 生僻字解决
 
一,基本情况
  txt文件导入到MSSQL的时候若碰到汉字后两位编码和字段分隔符编码相同时,导入结果在MSSQL中会后移一列
例如 “弢”,“ 韡 ” 十六进制编码分别是 8F7C 和ED7C 而字段分隔符号“|”编码是7C 因此在导入是会将汉字7C误认为|而结束一个字段


二,解决方案
  MSSQL提供多种文本导入的方法,目前只发现MSSQL的BCP.exe能够识别生僻汉字

  如下命令行:
  1)
bcp XYZJCG..ZJCG_JYXT_HSJK_HKGDXX in "c:/tmp/KHXX0518.TXT" -b1000 -c -t"|" -r"|"/n -S. -Usa -Psa
  2)
bcp XYZJCG..ZJCG_JYXT_HSJK_KHJBXX in "c:/tmp/KHXX0518.TXT" -b1000 -f c:/tmp/BCP_KHXX.txt -S. -Usa-Psa

  使用到的 bcp几个参数:
-f format_file
指定格式文件的完整路径,该格式文件包含以前在同一个表或视图上使用 bcp 时的存储响应。当使用由 format 选项所创建的格式文件大容量复制入或复制出数据时,使用此选项。格式文件的创建是可选的。在提示几个格式问题之后,bcp 将提示是否在格式文件中保存回答。默认文件名为 Bcp.fmt。大容量复制数据时,bcp 可引用一个格式文件,因此不必重新交互输入以前的回答。如果未使用此选项,也没有指定 –n、-c、-w、-6 或 -N,则 bcp 将提示输入格式信息。
      (注意-f参数和后面的模板文件有空格)
-c
使用字符数据类型执行大容量复制操作。此选项不提示输入每一字段;它使用 char 作为存储类型,不带前缀,/t(制表符)作为字段分隔符,/n(换行符)作为行终止符。
-t field_term
指定字段终止符。默认的字段终止符是 /t(制表符)。使用此参数替代默认字段终止符。
-r row_term
指定行终止符。默认的行终止符是 /n(换行符)。使用此参数替代默认行终止符。

 

  这两种方法均可以导入,但是发现当KHXX0518.TXT文件超过25M(估计)时候,使用第一种方法并不能解决上述问题,而第二种方法无此限制,可第二种方法依赖于模板BCP_KHXX.txt 。所以各有长短,使用看实际情况。
 
 

网页_疑难字_生僻字_解决方案

  • 2017年08月17日 17:22
  • 674KB
  • 下载

php生僻字的处理,插入数据库被截断,空白,乱码解决办法,php冷僻字处理

网上找了资料,以为是数据库编码,表编码,字段编码的问题,都改成了utf-8的,还是不行, 最终的解决办法: 将 $str_1=iconv(“GB2312″,”UTF-8″,$str_1); 改成 $s...
  • rgbhje
  • rgbhje
  • 2013年11月07日 15:57
  • 1605

AIX系统生僻字的解决方案

最近做优化人力资源系统碰到一个问题,就是有个人的姓名包含:(yan)这个生僻字,系统无法显示,导致该员工工资无法发出...          生产环境是:AIX6.1,Weblogic 10g,Or...

解决mysql生僻字中文乱码显示异常处理举例

解决mysql的utf8编码中生僻字写入时"Incorrect string value"错误其他中文显示非常正常,但是在写入“姮”、"旻"等比较生僻的人名时报告错误:Incorrect string...

由生僻字引发的修改SQL Server 的排序规则思考

背景: SQL Server 2008 R2的默认实例为【Chinese_PRC_CI_AS】,这个排序规则不支持生僻字“㑺”等的排序(),需修改为【Chinese_Simplified_Pinyin...

汉字转拼音(支持生僻字)

  • 2016年04月05日 11:54
  • 53KB
  • 下载

[微软拼音小技巧] 如何用Unicode输入生僻字

大家好,我是钱力强,微软拼音输入法的软件工程师。微软拼音有很多很好的功能,长期不为广大用户所了解。在有些时候,这些功能可能真的能够解决你的难题。 日前有新闻报道“山东两百村民因电脑不认生僻字...

处理生僻字

  • 2014年06月24日 11:46
  • 1.81MB
  • 下载

C#RichTextBox[自动选词]与[生僻字显示]问题

RichTextBox 的自动选词原系统设置默认打开的,如果我们有一个字符串为:“string数组”,想要选择“g数”这个字符时,RichTextBox已经为我们选择了“string数”字符。  想要...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:TXT导入MSSQL 生僻字解决
举报原因:
原因补充:

(最多只允许输入30个字)