在获取抖音视频中script内容的时候遇到了问题,或缺下图中script中的cover内容:
一、内容学习:正则表达式(re库)
1.1因为正则表达式也是用字符串表示的,所以,我们要首先了解如何用字符来描述字符。
https://www.runoob.com/python/python-reg-expressions.html
https://www.liaoxuefeng.com/wiki/1016959663602400/1017639890281664
字符 | 描述的字符 |
---|---|
\d | 可以匹配一个数字 |
\w | 可以匹配一个字母或数字 |
. | 可以匹配任意字符 |
* | 表示任意个字符(包括0个) |
+ | 表示至少一个字符 |
? | 表示0个或1个字符 |
\s | 表示至少一个空格 |
\S | 表示任意非空字符 |
{n} | 表示n个字符 |
{n,m} | 表示n到m个字符 |
案例:
\d{
3}\s+\d{
3,8}
解读一下:
\d{
3}表示匹配