下面是源码,用了python和正则表达式
import requests
from bs4 import BeautifulSoup
import re
import xlwt
finddata=re.compile(r'黄金价格.*收于(.*)美元/盎司;白银价格.*收于(.*)美元/盎司。')
fandlink=re.compile(r'href="(.*)" target="_blank">')
findday=re.compile(r'(中国工商银行金融市场部 (.*))</span>')
url1='http://www.icbc.com.cn/icbc/%e7%bd%91%e4%b8%8a%e9%bb%84%e9%87%91/%e8%b4%b5%e9%87%91%e5%b1%9e%e8%b5%84%e8%ae%af/%e5%b8%82%e5%9c%ba%e5%bf%ab%e6%8a%a5/default.htm'
url3='http://www.icbc.com.cn/icbc/%e7%bd%91%e4%b8%8a%e9%bb%84%e9%87%91/%e8%b4%b5%e9%87%91%e5%b1%9e%e8%b5%84%e8%ae%af/%e5%b8%82%e5%9c%ba%e5%bf%ab%e6%8a%a5/default-PageList-'
headers ={
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/101.0.4951.64 Safari/537.36 Edg/101.0.1210.47'}
def getdata(url2):
r = requests.get(url=url2