- 博客(2)
- 收藏
- 关注
原创 爬虫东方财富网(tbody)获取其title和链接
import requestsfrom bs4 import BeautifulSoupimport pprintimport json导入爬虫所需要的包def download_all_htmls(): htmls=[] for idx in range(1): url=f"http://data.eastmoney.com/zjlx/00000{idx+1}.html" print("craw html:",url) r..
2021-10-19 23:13:52 666
原创 爬虫东方财富网(tbody)
导入这四个包,以方便后续爬虫操作。定义一个函数,url是东方财富网第一支股票资金流向的链接。下载我们所爬取的页面。可以查看是否下载成功,如果没有报错,则证明下载成功,会显示如下页面:这一步的主要操作是:定义一个函数将我们所需要的变量爬取出来,再见其存入一个变量datas,最后返回datas,可以查看我们所需的数据,我们这变量是网页名及其对应的网址。将其打印出来看是否调取成功。将所有的网页中所需要的变量都存入all_datas,访问all_datas...
2021-10-19 00:50:19 631
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人