
Python 爬虫笔记
Python 爬虫笔记HTTP协议requests模块get() 和post()函数headers数据解析正则表达式bs4解析-HTML语法本文作为自学笔记,仅供参考学习课程:B站路飞学城IT爬虫:利用程序获取互联网上的资源。robots.txt协议 :规定网站中哪些数据不可以爬取, 只是协议,但并不能防止恶意爬取爬虫的一般步骤:拿到页面源代码解析该源代码,拿到数据在学习爬虫之前,要先了解一下HTTP协议。HTTP协议HTTP协议是万维网的通信基础。简单来说就是计算机访问网页所需













