网络爬虫基础4
以思维导图的方式记述爬虫学习基础,没有详细的信息,只有一些要点!
前言
记述了requests的使用,以及如何使用Python的多进程库multiprocessing来实现多线程爬虫,并实现一个爬虫案例。
思维导图
![在这里插入图片描述](https://img-blog.csdnimg.cn/08be056488f7444caeb56ddc95aaffbc.png?x-oss-process=image/watermark,type_ZHJvaWRzYW5zZmFsbGJhY2s,shadow_50,text_Q1NETiBA5pmo5pum6buY5ra1,size_20,color_FFFFFF,t_70,g_se,x_16#pic_center)
代码区
import requests
import re
''' 4.1 使用Python获取网页的源代码 '''
def get():
html_str = requests.get("http://exercise.kingname.info/exercise_requests_get.html").content.decode()
print(html_str,'\n')
'''
1.构建字典data,给各个元素赋具体的值
2.使用formdata或者json提交数据,参数为name和password
'''
def post():
data1 = {
'name':'1','password':'2333'}
html1_formdata = requests.post("http://exercise.kingname.info/exercise_requests_post",data=data1).content.decode()
html2_json = requests.post("http://exercise.kingname.info/exercise_requests_post",json=data1).content.decode()
print(html1_formdata)
print(html2_json)
def requests_re