在Python里用代码实现简单的获取数据
import requests
import re
url = 'https://movie.douban.com/top250' #要获取数据的网址
headers = {
'user-agent':' #这里输入自己的user-agent
'
} #手动加入请求头,以通过检测
resp = requests.get(url,headers=headers)
wj = resp.text
obj=re.compile(r'<li>.*?<span class="title">(?P<name>.*?)</span>',re.S)
result = obj.finditer(wj)
for it in result:
print(it.group('name'))
根据需求获取内容
获取结果如下:
后续可加入其他扩展