平安银行(000001)资金流向 _ 数据中心 _ 东方财富网 (eastmoney.com)
#导包
import requests
from bs4 import BeautifulSoup
import pandas as pd
【第一步】下载页面的HTML
构造函数download_all_htmls,下载页面的HTML
1、用requests.get函数获取html网页(构造一个向服务器请求资源的url对象,返回的是一个包含服务器资源的Response对象)
2、r.status_code返回http请求的返回状态:200表示连接成功,返回418表示爬取的网站有反爬虫机制,要向服务器发出爬虫请求,需要添加请求头headers
3、htmls.append(r.text)添加url对应的页面内容到列表htmls
def download_all_htmls():
htmls=[]
url=f"http://data.eastmoney.com/zjlx/000001.html"
print(url)
r=requests.get(url)
if r.status_code!=200:
raise Exception("error")
print(r)
htmls.append(r.text)
return htmls