好的,下面是一个使用Python编写的基本爬虫工具,它使用了Requests和BeautifulSoup库来获取和解析HTML页面。
import requests
from bs4 import BeautifulSoup
# 爬取指定URL的页面
def get_page(url):
response = requests.get(url)
if response.status_code == 200:
return response.text
else:
return None
# 解析页面并提取需要的数据