一、逻辑分析:Java实现将含有阿拉伯数字、中文字符的文本截取出来,在文本行每当遇到阿拉伯数字就开始截取,一直到下一个阿拉伯数字前,循环截取到没有阿拉伯数字为止。为了实现这个需求,可使用Java的正则表达式和Pattern、Matcher类来完成。
二、代码实现与效果展示
下面是实现上述功能的源代码,展示了如何从一个字符串中提取出所有包含阿拉伯数字的子串,直到下一个数字出现为止:
import java.io.File;
import java.io.FileNotFoundException;
import java.io.PrintStream;
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class TextExtractor {
public static void main(String[] args) {
String text = "这是一个测试文本123这是456789测试结束";
String text2 =" 不能不想你155让我悄悄的告诉你156一曲相思157爱你不变心158失望的诺言159是你在逃避我160不能不爱你161我该怎么做162相会在梦里163星夜的离别164你的世界我来过165今生最爱的人166痴情的人总受伤167能不能把你挽留168来生还等你169来生不再错过你170我把来生许给了你171有缘人172一心藏一人173有你无份爱一场174爱情蒙了眼175爱难留情难舍176无情的是你177一首醉人的歌178伤心的雪花179永远放你在心底180心锁181爱你每一天182醉人情歌183高原情歌184康定情歌185曼丽186来生不相遇187该爱还是恨188既然你已不爱我189后悔爱上我190一镂相思情191当做没有爱过我192谁为谁流泪193不要抛弃我194相思在梦里195没有归宿的落花196红颜知己197一去不回头198何必用钱谈感情199爱情难尝200都是为了你201为什么变了心202爱情一场梦203梦里梦外都是你204相思夜难眠205痴情注定没伤透206风雨念207绵绵细雨的夜晚208歌声念情209你是我最美相遇210负心的你211爱你永不变212错误的念曲213别为我伤心214祝福215旧梦216潮湿的心217为何要相遇218谎言天花乱坠219虚情的爱220孤独的我221昔别的海岸222一首深情的歌223无情的谎言224痴情的爱225何处觅知音226深情有几许227当做没爱过我228情网229求歌名230忘记不甘愿231是你变了心232你是我的情念233相思的滋味234爱情的滋味235别再轻易说分手236舍不得忘记你237卓玛238问情239晚秋240叹这一生241碎心石242望星空243长相依244乡间小路245踏浪246再会无缘的情人247我这样的人248男朋友249何不潇洒走一回250情路251杏花落252梅花三弄253爱的思念254涛声依旧255做你的爱人256姑娘我爱你257花开花落258哑巴新娘259好像天上风筝断了线,不知不觉爱上你260迷茫的爱261夜已沉默262为你而醉263那一夜264进退两难(歌曲及音乐)265茫雾的爱(歌曲及音乐)266天地不懂情(歌曲及音乐)267爱你无悔(歌曲及音乐)268射雕英雄传(铁血丹心歌曲及音乐)269上海滩(歌曲及音乐)270为何对你失了魂271有你就知足272你是演员273黄玫瑰274山坡坡275一曲相思唱不完276美人昑277相思比梦长278外婆的彭湖湾279笑脸280心的旎途 " ;
extractTextWithNumbers(text);//为了测试,临时注释
extractTextWithNumbers(text2);
RedirectOutput.RedirectOutput();
}
//这段代码的关键在于正则表达式 (\\d+[^\\d]*):
//\\d+ 匹配一个或多个数字。
//[^\\d]* 匹配任意数量的非数字字符。
//这样,每次Matcher.find()都会找到从一个数字开始,直到下一个数字前的所有内容,并通过Matcher.group()打印出来。
//如果你想要包括最后一个数字后的文本,即使它后面没有数字,可以稍微修改正则表达式为 (\\d+[^\\d]*)|([^\\d]+)$,这样可以匹配到字符串末尾的非数字内容。
public static void extractTextWithNumbers(String text2) {
// 正则表达式匹配从数字开始直到下一个数字前的所有内容
Pattern pattern = Pattern.compile("(\\d+[^\\d]*)");
// Matcher matcher = pattern.matcher(text); //为了测试,临时注释
Matcher matcher2 = pattern.matcher(text2);
//为了便于测试,临时将matcher改为matcher2
while (matcher2.find()) {
// 输出匹配到的子串
System.out.println(matcher2.group());//为了便于测试,临时将matcher改为matcher2
}
}
}
看到这里,您是不已经迫不及待想要看一下代码运行的效果呢?稍安勿躁,下面请跟随我见证奇迹吧!
(图1--开始拆分并输出歌单)
(图2--歌单全部拆分完成)
三、知识点复盘与总结
这段代码的关键在于正则表达式 (\\d+[^\\d]*):
1. \\d+ 匹配一个或多个数字。
2. [^\\d]* 匹配任意数量的非数字字符。
这样,每次Matcher.find()都会找到从一个数字开始,直到下一个数字前的所有内容,并通过Matcher.group()打印出来。
如果你想要包括最后一个数字后的文本,即使它后面没有数字,可以稍微修改正则表达式为 (\\d+[^\\d]*)|([^\\d]+)$,这样可以匹配到字符串末尾的非数字内容。
《------Finished------》
Welcome to my Blog.See you next time!