自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 爬虫东方财富网(tbody)获取其title和链接

import requestsfrom bs4 import BeautifulSoupimport pprintimport json导入爬虫所需要的包def download_all_htmls(): htmls=[] for idx in range(1): url=f"http://data.eastmoney.com/zjlx/00000{idx+1}.html" print("craw html:",url) r..

2021-10-19 23:13:52 666

原创 爬虫东方财富网(tbody)

导入这四个包,以方便后续爬虫操作。定义一个函数,url是东方财富网第一支股票资金流向的链接。下载我们所爬取的页面。可以查看是否下载成功,如果没有报错,则证明下载成功,会显示如下页面:这一步的主要操作是:定义一个函数将我们所需要的变量爬取出来,再见其存入一个变量datas,最后返回datas,可以查看我们所需的数据,我们这变量是网页名及其对应的网址。将其打印出来看是否调取成功。将所有的网页中所需要的变量都存入all_datas,访问all_datas...

2021-10-19 00:50:19 631

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除