java 去除空格、标点符号

public class TempTest {
    public static void main(String[] args) {
        //string去除空格
        String str="  hello   world  ";
        System.out.println(str);

        String str1=str.trim();//去除首尾空格
        System.out.println(str1);

        String str2=str.replace(" ","");//去掉所有空格,包括首尾,中间
        System.out.println(str2);

        String str3=str.replaceAll(" +","");//去掉所有空格,包括首尾,中间
        System.out.println(str3);

        String str4=str.replaceAll("\\s*",""); //可以替换大部分空白字符, 不限于空格 . 说明:\s 可以匹配空格、制表符、换页符等空白字符的其中任意一个
        System.out.println(str4);

        //string去除标点符号
        //正则表达式去除标点
        String stri="ss&*(,.~1如果@&(^-自己!!知道`什`么#是$苦%……Z,&那*()么一-=定——+告诉::;\"'/?.,><[]{}\\||别人什么是甜。";
        System.out.println(stri);

        String stri1=stri.replaceAll("\\p{Punct}","");//不能完全清除标点
        System.out.println(stri1);

        String stri2=stri.replaceAll("\\pP","");//完全清除标点
        System.out.println(stri2);

        String stri3=stri.replaceAll("\\p{P}","");//同上,一样的功能
        System.out.println(stri3);

        String stri4=stri.replaceAll("[\\pP\\p{Punct}]","");//清除所有符号,只留下字母 数字  汉字  共3类.
        System.out.println(stri4);
    }
}



运行结果:

  hello   world  
hello   world
helloworld
helloworld
helloworld
ss&*(,.~1如果@&(^-自己!!知道`什`么#是$苦%……Z,&那*()么一-=定——+告诉::;"'/?.,><[]{}\||别人什么是甜。
ss1如果自己知道什么是苦……Z,那么一定——告诉别人什么是甜。
ss~1如果^自己知道`什`么是$苦Z那么一=定+告诉><||别人什么是甜
ss~1如果^自己知道`什`么是$苦Z那么一=定+告诉><||别人什么是甜
ss1如果自己知道什么是苦Z那么一定告诉别人什么是甜


关于replace 和replaceAll:

replace(char oldChar,char newChar)

replace(CharSequence  target,CharSequence  replacement)

replaceAll(String regex,String replacement)

1)replace的参数是char和CharSequence,即可以支持字符的替换,也支持字符串的替换(CharSequence即字符串序列的意思,说白了也就是字符串);

2)replaceAll的参数是regex,即基于规则表达式的替换,比如,可以通过replaceAll("\\d", "*")把一个字符串所有的数字字符都换成星号;

  相同点是都是全部替换,即把源字符串中的某一字符或字符串全部换成指定的字符或字符串,如果只想替换第一次出现的,可以使用 replaceFirst(),这个方法也是基于规则表达式的替换,但与replaceAll()不同的是,只替换第一次出现的字符串;

  另外,如果replaceAll()和replaceFirst()所用的参数据不是基于规则表达式的,则与replace()替换字符串的效果是一样的,即这两者也支持字符串的操作;

  还有一点注意:执行了替换操作后,源字符串的内容是没有发生改变的.



  • 7
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 6
    评论
是的,成语词库的导入是整个成语接龙程序的基础。以下是一个简单的Java代码示例,用于读取txt文件中的成语并进行预处理: ```java import java.io.*; public class IdiomImporter { public static void main(String[] args) { String filePath1 = "全量成语.txt"; // 第一个txt文件路径 String filePath2 = "常用成语.txt"; // 第二个txt文件路径 try { BufferedReader br1 = new BufferedReader(new FileReader(filePath1)); BufferedReader br2 = new BufferedReader(new FileReader(filePath2)); String line; HashSet<String> idiomSet = new HashSet<String>(); // 使用HashSet去重 while ((line = br1.readLine()) != null) { String idiom = preprocess(line); // 进行预处理 if (!idiom.isEmpty()) { idiomSet.add(idiom); } } while ((line = br2.readLine()) != null) { String idiom = preprocess(line); if (!idiom.isEmpty()) { idiomSet.add(idiom); } } br1.close(); br2.close(); System.out.println("成功导入" + idiomSet.size() + "个成语。"); } catch (IOException e) { e.printStackTrace(); } } // 预处理函数,去除空格标点符号等 private static String preprocess(String idiom) { idiom = idiom.trim(); idiom = idiom.replaceAll("^[^\\u4e00-\\u9fa5]+|[^\\u4e00-\\u9fa5]+$", ""); // 去除开头和结尾的非汉字字符 return idiom; } } ``` 这个程序可以读取两个txt文件中的成语,并去除开头和结尾的非汉字字符,最终将成语存储到一个HashSet中,以实现去重功能。在实际使用中,还需要考虑到编码问题、文件路径问题、异常处理等其他细节。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值