20190610初识爬虫第二天

1、关于审查元素
既可以在网页上右击,点击“检查”,也可以直接按F12键
所谓审查元素,可以看下面这个链接。
审查元素
2、正则表达式
在这里插入图片描述
Python语言中的正则表达式都集中在re中,常用的函数有:
(1) match()
从字符串的起始位置开始匹配;若成功,返回匹配对象,否则返回None。
(2) search()
不要求从起始位置开始匹配,包含即可。
(3) group()和groups()
match()和search()返回的匹配对象有两个方法,分别是group()和groups()。
当匹配没有子组要求(子组要求即正则表达式中包含了上表中的(…)元字符,系统会匹配括号内的正则表达式并另存为子组)时,group()返回整个匹配 结果。groups()会返回空元祖。
当匹配有子组要求时,group()会返回指定子组,groups()返回所有子组的元祖。
(4) findall()
用于查找字符串中所有符合正则表达式的字符串,返回一个列表。使用频繁
(5) split()-----统计句子中有多少个单词
用于按某个字符将目标字符串分解成若干个部分,并将这些部分一列表的形式返回。
(6) sub()
用于 将替换目标字符串的某些字符。
(7) compile()
编译函数,通过预先编译,可以缩短正则表达式的匹配时间。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值