功能:
1、 获取 上交所 深 交所的股票信息
2、 输出保存到文件中
技术路线: requests -beatiful soup - re
候选:数据网站选择
1、静态网站,信息静态存在HTML页面中,非js 代码生成
2、 F12 , 源代码查看
多找信息源
方法:
1、 从东方财富网获取 股票列表信息
2、 根据股票列表逐个到百度股票 获取个股信息
3、 将结果存储到文件中
import requests
from bs4 import BeautifulSoup
import traceback
import re
def getHTMLText(url):
try:
r = requests.get(url)
r.raise_for_status()
r.encoding = r.apparent_encoding
return r.text
except:
return ""
def getStockList(lst, stockURL):
html = getHTMLText(stockURL)
soup = BeautifulSoup(html, 'html.parser')
a = soup.find_all('a')
for i in a:
try:
href = i.attrs['href']
lst.append(re.findall(r"[s][hz]\d{6}", href)[0])
except:
contin