Python笔记(二)

1.python中要用到的主要函数有split,strip,replace。
2.对于列表来讲,从0开始索引,可容纳任何对象
3.注意理解ord函数和chr函数。
4.类中self指的是类实例对象本身
5.url是互联网上标准资源的地址
6.爬虫原理中中主要包括多页面爬虫流程的跨页面爬虫流程。
7.from bs4 import BeautifulSoup  
8.requests库爬取有get(),post(),其中post()方法用于提交表单来爬取需要登录才能获得数据的网站。
9.beautifulsoup库可以轻松地解析requests库请求的网页,并把网页源代码解析为soup文档,以便过滤提取数据。
 
10.解析得到的Soup文档可以使用find()和find_all()方法以及selector()方法定位需要的元素。
11.通过get_text()方法可以获得爬取数据对应的文字信息。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

cykac1998

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值