Python爬取东方财经网

最新推荐文章于 2021-10-22 20:16:12 发布

小嘉今天学习了吗

最新推荐文章于 2021-10-22 20:16:12 发布

阅读量230

点赞数

文章标签： python 爬虫 pycharm

本文链接：https://blog.csdn.net/m0_56950461/article/details/120834595

版权

本文介绍了如何使用Python进行网络爬虫，具体步骤包括打开东方财经网，导入requests和pandas库解析HTML，抓取表格数据，并将数据存储到MySQL数据库中，最后展示导出的数据结果。

摘要由CSDN通过智能技术生成

打开网页

导入库

为了用Python爬取图中10*2的表格所对应的链接，用到requests， pandas库

import requests
from bs4 import BeautifulSoup
import pandas as pd

在网页源代码中找到表格所对应的代码，下载所有列表页面的HTML，用于后续的分析

def download_all_htmls():
    """
    下载所有列表页面的HTML，用于后续的分析
    """
    url = f"http://data.eastmoney.com/zjlx/000001.html"
    
    print("craw html:", url)
    r = requests.get(url,
                    headers={'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/94.0.4606.61 Safari/537.36 Edg/94.0.992

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小嘉今天学习了吗

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python爬取东方财经网

打开网页导入库为了用Python爬取图中10*2的表格所对应的链接，用到requests，pandas库import requestsfrom bs4 import BeautifulSoupimport pandas as pd在网页源代码中找到表格所对应的代码，下载所有列表页面的HTML，用于后续的分析def download_all_htmls(): """ 下载所有列表页面的HTML，用于后续的分析 """ url = f"h...
复制链接

扫一扫