本人为了采集相关网站,但由于自己喜爱的request http库停止更新,许多功能缺失,少了维护,而且python语法简洁程度让我特别喜爱(究其原因就是python成功采集)
直接上代码:
requests
import requests
url = 'www.xxx.login.action'
headers ={
"User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Mobile Safari/537.36"
}
data = {
'username': 'xxxx',
'passsword': 'xxxxxx'
}
requests.post(url,data,headers)
第一次接触python,本以为post能直接发送,结果总是无法通过,还以为设计了很高明的防爬技术,结果,就是python参数无法直接用变量代替
需要这样写:
import requests
url = 'www.xxx.login.action'
headers ={
"User-Agent": "Mozilla/5.0 (Linux; Android 6.0; Nexus 5 Build/MRA58N) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/89.0.4389.82 Mobile Safari/537.36"
}
data = {
'username': 'xxxx',
'passsword': 'xxxxxx'
}
requests.post(url=url,data=data,headers=headers)
大坑,本以为很简单,结果很久才通过