小福利，带你python爬取数据并存为excel文件

littlespider889

已于 2024-03-14 20:27:10 修改

阅读量48

点赞数

分类专栏：爬虫 python excel 文章标签： python excel 爬虫

于 2022-04-03 15:03:29 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/littlespider889/article/details/123937876

版权

python 同时被 3 个专栏收录

156 篇文章 9 订阅

订阅专栏

33 篇文章 3 订阅

订阅专栏

24 篇文章 3 订阅

订阅专栏

import requests, re, lxml
from lxml import etree
from bs4 import BeautifulSoup
import json
import pandas as pd

import openpyxl

wb = openpyxl.Workbook()
sheet = wb.active
sheet.title = 'news-online'

sheet['A1'] = '名称'  # 加表头，给A1单元格赋值
sheet['B1'] = '网址'  # 加表头，给B1单元格赋值
sheet['C1'] = '图片网址'  # 加表头，给C1单元格赋值



headers = {
            'Referer': 'https://news.qq.com',
            'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; rv:46.0) Gecko/20100101 Firefox/46.0',

        }

url = 'https://i.news.qq.com/trpc.qqnews_web.kv_srv.kv_srv_http_proxy/list?sub_srv_id=24hours&srv_id=pc&offset=0&limit=20&strategy=1&ext={"pool":["top"],"is_filter":7,"check_type":true}'
res = requests.get(url, headers=headers)
res1=res.json()
res2=res1['data']
datas=res2['list']
datas_list = []
for i in datas:
    datas_dict = {}
    datas_dict['标题']=i['title']
    datas_dict['网址'] = i['url']
    datas_dict['图片网址'] = i['thumb_nail']
    datas_list.append(datas_dict)


    row = [i['title'], i['url'],i['thumb_nail']]
    sheet.append(row)
wb.save('qqnews.xlsx')
df=pd.DataFrame(datas_list)
print(df)

excel文件截图如下
在这里插入图片描述

littlespider889

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
小福利，带你python爬取数据并存为excel文件

import requests, re, lxmlfrom lxml import etreefrom bs4 import BeautifulSoupimport jsonimport pandas as pdimport openpyxlwb = openpyxl.Workbook()sheet = wb.activesheet.title = 'news-online'sheet['A1'] = '名称' # 加表头，给A1单元格赋值sheet['B1'] = '网址'
复制链接

扫一扫

专栏目录

littlespider889 CSDN认证博客专家 CSDN认证企业博客

码龄4年

240: 原创

1万+: 周排名

2万+: 总排名

25万+: 访问

: 等级

3738: 积分

5805: 粉丝

322: 获赞

68: 评论

860: 收藏

私信

关注

热门文章

分类专栏

VBA 4篇
excel 33篇
tkinter 1篇
mysql 27篇
爬虫 24篇
python 156篇
spider 16篇
数据可视化 4篇
数据分析与挖掘 16篇
LAMP
Linux 2篇
word 2篇
scrapy 6篇
PMP 1篇
正则表达式 2篇
Flask 14篇
web安全测试 1篇
岭回归与lasso回归 1篇
线性回归分析 2篇
numpy 3篇
web安全攻防 1篇
vue 3篇
redis 3篇
Django 5篇
git 1篇
github 1篇
mongodb 3篇
词云图 2篇
urllib 1篇
笔记 2篇

最新评论

python的GUI编程初探，这部分内容真的非常有意思
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
用python的selenium模块自动爬取歌曲评论和登录豆瓣
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接；(3)增加除了各种控件外，文章正文的字数。
小福利，用xpath爬取电影数据
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用更多的站内链接；(2)增加条理清晰的目录；(3)提升标题与正文的相关性。
用Python的xpath模块学习抓取图片
CSDN-Ada助手: 行动是成功的阶梯，行动越多，登得越高。
小福利，爬取旅游攻略，做好攻略随时出发去旅游哦
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)增加除了各种控件外，文章正文的字数；(3)使用更多的站内链接。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。