编写一个截取字符串的函数,输入为一个字符串和字节数,输出为按字节截取的字符串,但要保证汉字不被截取半个.
如“我ABC”,4,应该截取“我AB”,
输入“我ABC汉DEF”,6,应该输出“我ABC”,而不是“我ABC+汉的半个”。
代码:
public class Test {
public static void main(String[] args) throws Exception{
String str = "落尘曦a的abc博客def";
int num = trimGBK(str.getBytes("GBK"),8);
System.out.println(str.substring(0,num) );
}
public static int trimGBK(byte[] buf,int n){
int num = 0;
boolean bChineseFirstHalf = false;
for(int i=0;i<n;i++)
{
if(buf[i]<0 && !bChineseFirstHalf){
bChineseFirstHalf = true;
}else{
num++;
bChineseFirstHalf = false;
}
}
return num;
}
}
输出:
落尘曦a
substring(int beginIndex)
返回一个新的字符串,它是此字符串的一个子字符串。该子字符串始于指定索引处的字符,一直到此字符串末尾。
例如:
"unhappy".substring(2) returns "happy"
"Harbison".substring(3) returns "bison"
"emptiness".substring(9) returns "" (an empty string)
参数:
beginIndex - 开始处的索引(包括)。
返回:指定的子字符串。
抛出:IndexOutOfBoundsException - 如果 beginIndex 为负或大于此 String 对象的长度。
----------------------------------------------------------------------------------------------------------------------------------------------------------------
substring(int beginIndex, int endIndex)
返回一个新字符串,它是此字符串的一个子字符串。该子字符串从指定的 beginIndex 处开始, endIndex:到指定的 endIndex-1处结束。
示例:
"hamburger".substring(3,8) returns "burge"
"smiles".substring(0,5) returns "smile"
参数:
beginIndex - 开始处的索引(包括)。
endindex 结尾处索引(不包括)。
返回:指定的子字符串。
抛出:IndexOutOfBoundsException - 如果 beginIndex 为负,或length大于字符串长度。
----------------------------------------------------------------------------------------------------------------------------------------------------------------
js示例
var str="Hello world!"
document.write(str.substring(1,3));
上面返回字符串:"el";
str.substring(1,2) //返回e
str.substring(1) //返回"ello world";
还有此函数中会出现奇怪的现象,当出现str.substring(5,0);
这又是怎么回事,不过返回的是"hello",
str.substring(5,1) //返回"ello",截去了第一位,返回余下的.
可见substring(start,end),可以有不同的说明,即start可以是要返回的长度,end是所要去掉的多少个字符(从首位开始).
在JS中,substr(start,length),用得较方便.
slice() 方法可通过指定的开始和结束位置,提取字符串的某个部分,并以新的字符串返回被提取的部分。
var str = "0123456789";
console.log("原始字符串:", str);
console.log("从索引为3的字符起一直到结束:", str.slice(3)); //3456789
console.log("从倒数第3个字符起一直到结束:", str.slice(-3)); //789
console.log("从开始一直到索引为5的前一个字符:", str.slice(0,5)); //01234
console.log("从开始一直到倒数第3个字符的前一个字符:", str.slice(0,-3)); //0123456
console.log("从索引为3的字符起到索引为5的前一个字符:", str.slice(3,5)); //34
console.log("从索引为3的字符起到倒数第3个字符的前一个字符:", str.slice(3,-3)); //3456
substring 方法用于提取字符串中介于两个指定下标之间的字符。
var str = "0123456789";
console.log("原始字符串:", str);
console.log("从索引为3的字符起一直到结束:", str.substring(3)); //3456789
console.log("从索引为20的字符起一直到结束:", str.substring(20)); //
console.log("从索引为3的字符起到索引为5的前一个字符结束:", str.substring(3,5)); //34
console.log("start比end大会自动交换,结果同上:", str.substring(5,3)); //34
console.log("从索引为3的字符起到索引为20的前一个字符结束:", str.substring(3,20)); //3456789
substr 方法用于返回一个从指定位置开始的指定长度的子字符串。
var str = "0123456789";
console.log("原始字符串:", str);
console.log("从索引为3的字符起一直到结束:", str.substr(3)); //3456789
console.log("从索引为20的字符起一直到结束:", str.substr(20)); //
console.log("从索引为3的字符起截取长度为5的字符串:", str.substr(3,5)); //34567
console.log("从索引为3的字符起截取长度为20的字符串:", str.substr(3,20)); //3456789
indexOf返回字符串中匹配子串的第一个字符的下标。
var str = "JavaScript";
var i1 = str.indexOf("a"); //1
var i2 = str.indexOf("S"); //4
var i3 = str.indexOf("Script"); //4
var i4 = str.indexOf("k"); //-1
console.log("原始字符串:", str);
console.log("a的索引:", i1);
console.log("S的索引:",i2);
console.log("Script的索引:",i3);
console.log("k的索引:",i4);
lastIndexOf返回从右向左出现某个字符或字符串的首个字符索引值(与 indexOf 相反)
var str = "JavaScript";
var i1 = str.lastIndexOf("a"); //3
var i2 = str.lastIndexOf("S"); //4
var i3 = str.lastIndexOf("Script"); //4
var i4 = str.lastIndexOf("k"); //-1
split使用一个指定的分隔符把一个字符串分割存储到数组。
var str = "jpg|bmp|gif|ico|png";
var arr= str.split("|");
console.log(arr); // ["jpg","bmp","gif","ico","png"]
join使用一个指定的分隔符将一个数组合并为一个字符串。
var arr= new Array("jpg","bmp","gif","ico","png");
var str = arr.join("|");
console.log(str); //jpg|bmp|gif|ico|png
concat将两个数组连接在一起。
var arr1 = [1, 2, 3];
var arr2 = [4, 5, 6];
var arr3 = arr1.concat(arr2);
console.log(arr3); //[1, 2, 3, 4, 5, 6]
charAt返回指定位置的字符。字符串中第一个字符的下标是 0。
var str = "abcdefg";
var char = str.charAt(2);
console.log(char); //c