在这里我想得到通过2020年3月23日和3月24日的历史股票数据得到上证50的成分股的收益率。
代码
–import 需要的模块
import numpy as np
import pandas as pd
import requests
from bs4 import BeautifulSoup
import urllib.request
import re
代码
–倒入上证50的ticker
ticker=pd.read_excel("ticker.xlsx",dtype=object)
dtype=object 是为了使得股票代码如000001不会变成1,少了前置的0。
页面数据:可以看出来表格是有11列的。我只需要第一列日期和第5列数据。python中为0和4。
代码
–从html中提取tbody中的td
def data():
price=[]
date=[]
for tr in soup.find_all('tr')