Python学习记录7-------爬取网页json数据储存到数据库

#在网页上爬取json数据
import requests
import json
import pymysql

moveList=[]

#获取数据库连接
con=pymysql.connect(
    #主机名
    host='127.0.0.1',
    port=3306,
    user='root',
    password='root',
    charset='utf8',
    db='homework'
)

#爬取json数据
for page in range(2):
    url="https://movie.douban.com/j/search_subjects?type=movie&tag=%E7%83%AD%E9%97%A8&sort=recommend&page_limit=20&page_start={}".format(page*20)
    print(url)
    data=requests.get(url).text
    for ele in json.loads(data).get("subjects"):
        moveList.append(ele)
print(moveList)

#数据库操作
cursor=con.cursor()
sql="insert into movies(title,url,cover) values('%s','%s','%s')"
for ele in moveList:
    cursor.execute(sql % (ele['title'],ele['url'],ele['cover']))
con.commit()
cursor.close()
con.close()

使用Django框架做的web爬虫demo:https://download.csdn.net/download/hi_sir_destroy/11388170

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值