爬虫：爬取有table标签的表格数据

最新推荐文章于 2024-06-05 14:36:31 发布

置顶谈笑江湖

最新推荐文章于 2024-06-05 14:36:31 发布

阅读量7.1k

点赞数 2

分类专栏：爬虫——python

本文链接：https://blog.csdn.net/weixin_44824389/article/details/104421233

版权

爬虫——python 专栏收录该内容

3 篇文章 0 订阅

订阅专栏

爬虫：爬取有table标签的表格数据

简单使用方法：# 谷歌浏览器 -> 审查元素 -> copy selector 如果截取不到，截取一部分前半部分

select：

url = 'http://s.askci.com/stock/a/?reportTime=2017-12-31&pageNum=1'
city_list = ['http://s.askci.com/stock/a/?reportTime=2017-12-31&pageNum=1']

for city_url in city_list:
    url = city_url
    headers = {
        'User-Agent': '*********************8'
    }
    
    html = requests.get(url, headers=headers)
    html = html.text
    soup = BeautifulSoup(html,  'html', from_encoding='utf-8')  # html
    
    # 谷歌浏览器 -> 审查元素 -> copy selector  如果截取不到，截取一部分前半部分
    #body > div.content > div.right_frame > div:nth-child(2) > div.public_table_box.mg_tone
    # content = soup.select('body > div.content > div.right_frame > div:nth-child(2) > div.public_table_box.mg_tone > div:nth-child(1) > div.public_ta_b_l_com.mg_tone > table')[0]
    content = soup.select('body > div.content > div.right_frame > div:nth-child(2) > div.public_table_box.mg_tone')[0]
    tf = pd.read_html(content.prettify(), header=0)  # prettify():页面美化（整理成有格式的） #myTable04
    print(tf)

在这里插入图片描述

谈笑江湖

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
爬虫：爬取有table标签的表格数据

爬虫：爬取有table标签的表格数据简单使用方法：# 谷歌浏览器 -> 审查元素 -> copy selector 如果截取不到，截取一部分前半部分select：url = 'http://s.askci.com/stock/a/?reportTime=2017-12-31&pageNum=1'city_list = ['http://s.askci.com/stoc...
复制链接

扫一扫

专栏目录