1.python中要用到的主要函数有split,strip,replace。
2.对于列表来讲,从0开始索引,可容纳任何对象
3.注意理解ord函数和chr函数。
4.类中self指的是类实例对象本身
5.url是互联网上标准资源的地址
6.爬虫原理中中主要包括多页面爬虫流程的跨页面爬虫流程。
7.from bs4 import BeautifulSoup
8.requests库爬取有get(),post(),其中post()方法用于提交表单来爬取需要登录才能获得数据的网站。
9.beautifulsoup库可以轻松地解析requests库请求的网页,并把网页源代码解析为soup文档,以便过滤提取数据。
10.解析得到的Soup文档可以使用find()和find_all()方法以及selector()方法定位需要的元素。
11.通过get_text()方法可以获得爬取数据对应的文字信息。
Python笔记(二)
最新推荐文章于 2024-04-27 17:30:34 发布