东方财富：网址和项目名称爬取

最新推荐文章于 2024-04-16 15:33:32 发布

ArtistBang

最新推荐文章于 2024-04-16 15:33:32 发布

阅读量464

点赞数

分类专栏：爬虫文章标签：爬虫 python

本文链接：https://blog.csdn.net/weixin_52360620/article/details/120818224

版权

平安银行(000001)资金流向 _ 数据中心 _ 东方财富网 (eastmoney.com)

#导包
import requests
from bs4 import BeautifulSoup
import pandas as pd

【第一步】下载页面的HTML

构造函数download_all_htmls，下载页面的HTML

1、用requests.get函数获取html网页（构造一个向服务器请求资源的url对象，返回的是一个包含服务器资源的Response对象）

2、r.status_code返回http请求的返回状态：200表示连接成功，返回418表示爬取的网站有反爬虫机制，要向服务器发出爬虫请求，需要添加请求头headers

3、htmls.append(r.text)添加url对应的页面内容到列表htmls

def download_all_htmls():
    htmls=[]
    url=f"http://data.eastmoney.com/zjlx/000001.html"
    print(url)
    r=requests.get(url)
    if r.status_code!=200:
        raise Exception("error")
    print(r)
    htmls.append(r.text)
    return htmls

【第二步】解析HTML得到数据

构造函数parse_single_html&#

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ArtistBang

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
东方财富：网址和项目名称爬取

平安银行(000001)资金流向 _ 数据中心 _ 东方财富网 (eastmoney.com)#导包import requestsfrom bs4 import BeautifulSoupimport pandas as pd【第一步】下载页面的HTML构造函数download_all_htmls，下载页面的HTML1、用requests.get函数获取html网页（构造一个向服务器请求资源的url对象，返回的是一个包含服务器资源的Response对象）2、r.status_co
复制链接

扫一扫