(?<![a-z0-9章])\s([^a-z]*?)
匹配前后都不是数字或字母的空格(前面为第x章除外),用于删去文本中多余空格第一章 (前面为"章",此处空格不匹配)大厅She (前后为字母,此处空格不匹配)started to...她开始 (匹配此处多余空格)走同周游中国各地的旅程
<[^<>]*>
匹配HTML标签(不支持嵌套,但可多次替换删除)
[一二三四五六七八九十]
匹配中文章节
(?<=[一二三四五六七八九十]) (?!卷)
匹配前面为中文序号,后面不为卷的空格,替换成顿号"、"或点"."一 (此处空格匹配)大厅第 一 (此处空格不匹配)卷
(.+)(?=\r\n\1\r\n)
匹配相同两行的前一行(捕获并自动分组)大厅 (匹配这一行内容,不含换行)大厅
(?<=,\d{3})\r\n(?!\{)
匹配字幕时间轴后换行(换行后没有大括号)00:04:03,700 --> 00:04:05,290 (匹配此处换行)(此处没有“{”)快踩油门啊,伙计!Step on the gas, dude!