Pyspider框架爬取json数据-并存入mysql

最新推荐文章于 2024-08-22 02:30:23 发布

x_bessie

最新推荐文章于 2024-08-22 02:30:23 发布

阅读量1.9k

点赞数

分类专栏： python爬虫安装使用方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/x_bessie/article/details/85714715

版权

本文介绍了如何使用Pyspider框架从一个JSON数据接口抓取信息，并将数据存储到MySQL数据库中。首先，通过Anaconda安装配置Pyspider，然后利用提供的API接口获取新闻数据。数据格式为JSON，包含多个条目。接着，设计数据库表结构以适应这些数据，最后编写Pyspider爬虫程序实现数据抓取和入库。源代码可在GitHub找到。

摘要由CSDN通过智能技术生成

使用Pyspider框架爬取数据

安装配置：

Anaconda3 5.2.0 ——python3.6
安装命令：
pip install pyspider

pip install pymysql

终端启动命令：

pyspider

进入pyspider dashboard ： localhost:5000

官网上面给了很多用法：
http://docs.pyspider.org/en/latest/

我这里简单的结合一个API接口来获取里面的数据
数据接口来自：https://newsapi.org
免费使用里面的接口，只要申请一个apikey。自行申请不介绍了。
里面的数据是这样子的：
在这里插入图片描述

现在的任务是：爬取上面articles里每一个author,title,url,publishedAt并把书存入mysql数据库中.

任务思维：
1.目标的数据是怎样的数据(格式，类型)？
2.如何获取数据？
3.分析完需要获取的设计数据库

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

x_bessie CSDN认证博客专家 CSDN认证企业博客

码龄7年

27: 原创

11万+: 周排名

102万+: 总排名

7万+: 访问

: 等级

1048: 积分

12: 粉丝

22: 获赞

13: 评论

115: 收藏

私信

关注

分类专栏

HTTP
I/O 1篇
Java 13篇
线程并发 4篇
算法 2篇
Hbase 1篇
安装使用方法 5篇
python 8篇
python爬虫 3篇
自动化 1篇
Mybatis 1篇
RNN 1篇
使用方法 6篇
机器学习 3篇
数据结构 1篇
自然科学语言 4篇
大数据 4篇
bat批处理 1篇
统计学习方法 1篇
后端 5篇

最新评论

搭建邮件服务器提示554 DT:SPM 163
菜2001: 我这个换了个网络热点为什么就发送成功了，也是554 DT:SPM，一换回来又失败
python爬取数据（豆瓣上TOP250的电影信息）初学者必看！！！
x_bessie: 努力终有所报，一起加油！
python爬取数据（豆瓣上TOP250的电影信息）初学者必看！！！
mikey桑: 使用xpath代码爬取豆瓣图书的信息成功，非常感谢
python爬取数据（豆瓣上TOP250的电影信息）初学者必看！！！
CHENKIKO: 博主您好，我们最近在做一个关于豆瓣电影的收集整理工作，很冒昧的打扰您，可以把那个豆瓣电影TOP250的表发给我用一下不！真的超级超级感谢?有偿
搭建邮件服务器提示554 DT:SPM 163
x_bessie 回复 jiang451933026: 这个还是权限的问题哦，你把授权码这些改好之后。再对自己发送邮件，发送的不能太简单。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。