为什么只是好奇的先读html文件,然后再写呢?Pandas可以直接接受html请求:import pandas as pd
symbol = 'AAPL'
url = 'https://finance.yahoo.com/quote/%s/financials?p=%s' %(symbol, symbol)
dfs = pd.read_html(url)
print(dfs[0])
第二,不知道为什么你会出现每年的约会。按照我上面的方式来做就是九月。在
^{pr2}$
对于第二部分,您可以尝试从以下几种方法中找到数据1:
1)检查XHR请求,并通过在生成该数据的请求url中包含参数来获取所需的数据,并可以json格式返回给您(当我查找时,我无法立即找到,因此转到下一个选项)
2)搜索
3)使用selenium模拟打开浏览器,获取表格,然后单击“季度”,然后获取该表格
我选择了选项3:from selenium import webdriver
import pandas as pd
symbol = 'AAPL'
url = 'https://finance.yahoo.com/quote/%s/financials?p=%s' %(symbol, symbol)
driver = webdriver.Chrome('C:/chromedriver_win32/chromedriver.exe')
driver.get(url)
# Get Table shown in browser
dfs_annual = pd.read_html(driver.page_source)
print(dfs_annual[0])
# Click "Quarterly"
driver.find_element_by_xpath("//span[text()='Quarterly']").click()
# Get Table shown in browser
dfs_quarter = pd.read_html(driver.page_source)
print(dfs_quarter[0])
driver.close()