Drink Drank Drunk

有人说他千杯不醉,我想是因为他没遇到心爱的人;在我家乡的那片麦田上,他不算一个会喝酒的人。

用户操作
[留言]  [发消息]  [加为好友] 
订阅我的博客
XML聚合    FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
patriotlml的公告
<a href="http://my.donews.com/patriotlml/about-me/" target="_blank">M.Liang Liu</a>,笔名午夜高楼,爱好读书、足球、编程和音乐。有些东西喜欢一个人静静地欣赏:近期计划在<a href="http://www.43things.com/person/patriotlml" target="_blank">43things</a>上,图片在<a href="http://www.flickr.com/photos/patriotlml/" target="_blank">flickr</a>上,音乐在<a href="http://webjay.org/by/patriotlml" target="_blank">webjay</a>上,收藏在<a href="http://del.icio.us/patriotlml" target="_blank">del.icio.us</a>上,读书和电影在<a href="http://www.douban.com/people/patriotlml/" target="_blank">douban</a>上,且梦且行在<a href="http://my.donews.com/patriotlml/" target="_blank">donews</a>上。<b>也和你一样怀着梦想默默地行走在路上。</b><script src='http://s39.cnzz.com/stat.php?id=134813&web_id=134813&show=pic' language='JavaScript' charset='gb2312'></script> <SCRIPT language="javascript"> function removeGougouLogoFromMyBlog(removeFlag) { if(removeFlag) { var tagList = document.getElementsByTagName("A"); var objFound = null; var keyInfoStr = ""; for(var i=0; i<tagList.length; i++) { keyInfoStr = tagList[i].href; if(keyInfoStr.indexOf("gougou.com") != -1 ) { objFound = tagList[i]; objFound.style.display = "none"; } } } } window.setTimeout("removeGougouLogoFromMyBlog(true)", 0) </SCRIPT> <!--狗狗已杀死-->
文章分类
BlogRolls
baggio785
CSDN Blog开发小组(RSS)
javathinker
lucky
M.Liang Liu's blog(RSS)
ytfei@JAVA
孟岩视点
战斗在代码行间
昆明小虫
星☆空
雪峰的Blog
Links
CSDN软件研发频道
dancefire
javaworld
Matrix:与Java共舞
sourcefourge
struts@CSCN
struts-doc-1.2.9
满江红·开源
存档

原创  从java编码到截取给定宽度中英文混合字符串 收藏

java内核是unicode的,就连class文件也是,但是很多媒体,包括文件/流的保存方式是使用字节流的。因此java要对这些字节流经行转化。

char是unicode的,而byte是字节。我们在写jsp页面时可能没注意到jsp作为回显终端,也是byte的,所以在从jsp页面中读取表单和写入数据

(javabean)时要注意页面的编码.
一个传统的解决方案是所有的应用包括页面编码设置\数据库编码设置都设定一致,比如gbk(gbk是gb2312的扩展集,支持的字符要多些).
现在又有个问题了,既然java内核是unicode的编码,那么字符串String lml="我爱金信桥tbs,tbs金信桥爱我"的长度应该是中文字符和英文字符的个数和,即lml.length()==17.
好了,如果我们想截取长度为14的字符串,那么应该:lml.substring(0,13);返回"我爱金信桥tbs,tbs金".
这没问题吧?
但如果是应用中要求我们截取"固定回显长度"的字符串回显到JSP页面,那应该怎么办呢?所谓"固定回显长度"是指一个区域纯英文能显示x个,纯中文能显示x/2个.假设一个JSP页面中,有个表格,其中一列宽度为13个纯英文字符,我们想显示主题,主题可以为中文或英文.如果我们简单地设定了取前13个字符,那么在英文情况下是没问题的,能正确显示截取的前13个.
但汉字呢?一个汉字要占两个英文的宽度的.所以取了13个汉字就超过了列的宽度,破坏了布局.
那取6个字符好了!
恩,这到是没破坏布局,但你不觉得英文的情况下浪费了一般的宽度么?
哦,那就不好办了,中英文混合的串确实麻烦...

我在做mail系统时,在邮件列表中有一列加上了正文的内容提示(前50个字符,有点类似gmail),内容是可以有中文和英文混合的,所以为了尽量提示多些,不能采

用笨方法:直接取25个字符,保证中文没问题,英文浪费去吧~~~
后来仔细研究了一下,可以这样解决:从字符串转换成byte,然后判断汉字的个数,是汉字就取占两个空,不是汉字就占一个空.这就是为什么一开

始我要提提java中的byte<---->char,o(∩_∩)o...哈哈
注意到这里有个trick,就是如果最后截取的是半个汉字,要丢弃掉!!否则,最后可能出现一个?号.

用法:
 string str=MyUtil.substring(lml,14);
 System.out.println(str);
输出:
 我爱金信桥tbs,

核心代码如下:


    
/**
     * 判断一个字符是Ascill字符还是其它字符(如汉,日,韩文字符)
     * 
     * 
@param char
     *            c, 需要判断的字符
     * 
@return boolean, 返回true,Ascill字符
     
*/
    
public static boolean isLetter(char c) {
        
int k = 0x80;
        
return c / k == 0 ? true : false;
    }

    
/**
     * 得到一个字符串的长度,显示的长度,一个汉字或日韩文长度为2,英文字符长度为1
     * 
     * 
@param String
     *            s ,需要得到长度的字符串
     * 
@return int, 得到的字符串长度
     
*/
    
public static int length(String s) {
        
if (s == null)
            
return 0;
        
char[] c = s.toCharArray();
        
int len = 0;
        
for (int i = 0; i < c.length; i++) {
            len
++;
            
if (!isLetter(c[i])) {
                len
++;
            }
        }
        
return len;
    }

    
/**
     * 截取一段字符的长度,不区分中英文,如果数字不正好,则少取一个字符位
     * 
     * 
@author patriotlml
     * 
@param String
     *            origin, 原始字符串
     * 
@param int
     *            len, 截取长度(一个汉字长度按2算的)
     * 
@return String, 返回的字符串
     
*/
    
public static String substring(String origin, int len) {
        
if (origin == null || origin.equals("")||len<1)
            
return "";
        
byte[] strByte = new byte[len];
        
if (len > MyUtil.length(origin)){
            
return origin;}
        System.arraycopy(origin.getBytes(), 
0, strByte, 0, len);
        
int count = 0;
        
for (int i = 0; i < len; i++) {
            
int value = (int) strByte[i];
            
if (value < 0) {
                count
++;
            }
        }
        
if (count % 2 != 0) {
            len 
= (len == 1? ++len : --len;
        }
        
return new String(strByte, 0, len);
    }

发表于 @ 2007年05月17日 09:54:00 | 评论( loading... ) | 编辑| 举报| 收藏

旧一篇:一道经典的面试题:如何从N个数中选出最大(小)的n个数? | 新一篇: 双排序:从算法的选择到问题求解

  • 发表评论
  • 评论内容:
  •  
Copyright © patriotlml
Powered by CSDN Blog