Java中文识别问题完全解决办法[一]

原创 2004年08月15日 00:05:00

版权归 石太祥 (ealpha(AT)msn(DOT)com)所有;

联系:   msn: ealpha(AT)msn(DOT)com

            QQ : 9690501

 

==============================================================================

由于部分网友提示说文章解决不是很全面,我会再发一个新的类,用来解决一般的中文的问题的!

==============================================================================

Java 不能正确显示中文一般是如下两种情况 <?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

许多情况应该针对环境变量,调试环境来确定转码方式!以下方法能够解决大多的问题!


1
、如果JDBC能正确存取中文的话.
PAGE 指令中试试contenttype="text/html chaterset=gb2312" 

例:
<%@?page?language="java"??contentType="text/html;?charset=GB2312"?import="java.sql.*" %>


2
JDBC中无法正确存储中文
1 String address=request.getParameter("address"); 
byte[] tmpbyte=address.getBytes("ISO8859_1"); 
address=new String(tmpbyte); 
2
 
String name=request.getParameter("name"); 
name = new String(name.getBytes("gb2312"),"ISO8859_1"); 

"ISO8859_1" "gb2312"可以尝试交换

例:

/**************************************************************************
nickname        
为一个假设的字段
tm nickname      
转码时候临时字段
**************************************************************************/

     String nickname=rs.getString("nickname").trim();   //读出信息  ****
     byte[] tmnickname=nickname.getBytes("ISO8859_1");  //
对信息进行编码转换 tm**** 临时存储数据

nickname=new String(tmnickname);                   //
将转换后的 tm**** 赋给字段 ****

java实现汉字判断+中文符号判断

java一般的中文判断都是利用正则表达式 Pattern pattern = Pattern.compile("[\u4e00-\u9fcc]+"); System.out.println(pat...
  • qwkxq
  • qwkxq
  • 2016年12月07日 17:48
  • 2228

java 汉字转拼音(解决多音字问题)

上一篇文章 Java 汉字转拼音 介绍了Java 中利用Pinyin4j 实现汉字转拼音,但是对于多音字问题采取的是组合拼音方式,例如长沙 取拼音结果就是 changsha zhangsha。某些情况...
  • hao_kkkkk
  • hao_kkkkk
  • 2016年06月29日 09:33
  • 2671

TensorFlow与中文手写汉字识别

转自:http://hacker.duanshishi.com/?p=1753 GitHub: https://github.com/burness/tensorflow-101/tree/mast...
  • czq7511
  • czq7511
  • 2017年05月25日 14:12
  • 1010

基于tesseract_ocr实现图片中汉字辨识

最近在研究视频字幕识别,写了一个小的程序,得到一些实验结果,同时也存在着一些问题,这里拿出来和大家分享下。 1.工具 (1)tesseract_ocr(识别汉字); (2)vs2010; (3...
  • ZhanCF
  • ZhanCF
  • 2015年10月30日 17:27
  • 1969

java实现汉字验证码,包含验证输入。

今天整理了一个java实现的汉字输入验证码 主要包含两个类,一个是生成验证码,一个是判断验证码输入是否正确 实现原理非常简单,将汉字和干扰线生成图片并将汉字保存到session,前台获取每次生成验...
  • hc1104
  • hc1104
  • 2013年11月19日 16:33
  • 1204

Java判断输入的String是否为中文方法总结

今天遇到的问题是如何判断输入的字符串是汉字,现将学习到的方法转载、记录总结如下: Java用的是Unicode 编码char 型变量的范围是0-65535 无符号的值,可以表示 65536个字符,基...
  • u011240877
  • u011240877
  • 2015年11月18日 15:37
  • 6719

中文分词之识别语义

中文分词之识别语义 一、      概述: 我们都知道、对于搜索引擎、如果利用现成的框架是比较容易实现以下步骤:获取文本内容、建立索引、分词识别、检索。但是这并不能保证检索出来的东西是我们想要的结果。...
  • u010666884
  • u010666884
  • 2015年12月15日 21:38
  • 3182

用 keras 建立超简单的汉字识别模型

之前看过很多 mnist 的识别模型,都是识别数字的,为啥不做一个汉字识别模型呢?因为汉字手写的库找不到啊。当时我还想自己从字库生成汉字用作识别(已经做出来了,导出字体图片再识别之)。 后来看了这篇...
  • codebay118
  • codebay118
  • 2017年05月22日 21:04
  • 1215

java实现随机中文验证码

现在很多应用的验证码采用的中文验证码,一定程度的放大了OCR之类的图像识别破解验证码的难度,原理主要是中文编码的生成格式,规定两个127以后的字节组合在一起形成一个汉字,前面的一个字节(高位)从0xA...
  • u013926110
  • u013926110
  • 2015年03月24日 22:35
  • 1535

tf28: 手写汉字识别

MNIST手写数字数据集通常做为深度学习的练习数据集,这个数据集恐怕早已经被大家玩坏了。本帖就介绍一个和MNIST类似,同时又适合国人练习的数据集-手写汉字数据集,然后训练一个简单的Deep Conv...
  • u014365862
  • u014365862
  • 2016年12月26日 13:36
  • 9940
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Java中文识别问题完全解决办法[一]
举报原因:
原因补充:

(最多只允许输入30个字)