说明
最近需要用到一些HTTP的代理,用于爬虫去爬取信息,搜索了一些网站,貌似现在这类提供免费代理IP的网站很多,刚好最近看了点vue的视频,弄个网站练练。
部署到heroku,预览地址:点击这里
FastAPI
- 安装相关依赖
pip install uvicorn fastapi requests bs4 jinja2 aiofiles
- 一个简单的函数爬取代理
def Spider(cat):
url = '目标网站'
headers = {"User-Agent":"Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}
try:
res = requests.get(url,headers=headers)
res.encoding = "utf-8"
soup = BeautifulSoup(res.text, 'html.parser')
html = soup.select(’bs4‘)
return html[0]
except:
return 'error'
- 前台点击按钮触发爬虫,返回数据<