爬虫学习第二天ajax请求
目标抓取豆瓣网动态页面的电影目录
代码如下
from urllib.request import Request,urlopen
from fake_useragent import UserAgent
base_url = "https://movie.douban.com/j/chart/top_list?type=5&interval_id=100%3A90&action=&start={}&limit=20"
i = 0
while True:
headers = {
"User-Agent": UserAgent().chrome
}
url = base_url.format(i * 20)
request = Request(url,headers=headers)
response =urlopen(request)
info = response.read().decode()
print(info)
if info==""or info is None:
break
i += 1
中间遇到的问题有:
1、请求模块Request写掉了导致报错:NameError: name ‘Request’ is not defined
2、在代码运行的时候最后出现了很多的:[] 问了大佬,大佬们说是应该匹配到了,不知道博客里面的大佬有没有知道原因的,该怎么处理这个问题的。
注:小菜鸟一枚刚接触python,代码照着视频里老师写的。