python爬虫并将数据存储到MySQL或Excel中

最新推荐文章于 2022-05-15 23:27:22 发布

captainNYS

最新推荐文章于 2022-05-15 23:27:22 发布

阅读量1.8k

点赞数

分类专栏：爬虫 mysql 文章标签：爬虫 python mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/captainnys/article/details/81269306

版权

爬虫爬取的是豆瓣top250图书，以存储到MySQL为例，流程如下：

1.先建表，可以用命令行，也可以用数据库可视化软件，建立好需要用的到的字段

2.写好爬虫，并在爬虫中连接数据库，把爬下来的数据按对应的字段填入数据库中

# -*- coding: utf-8 -*-
# Captain_N


from lxml import etree
import random
import requests
import time
import pymysql   #导入相应库文件

conn = pymysql.connect(host='localhost',user='root',password='1234',db='DouBan',port=3306,charset='utf8')
cursor=conn.cursor()    #连接数据库及光标
headers={
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.26 Safari/537.36 Core/1.63.5478.400 QQBrowser/10.1.1550.400'
}     #请求头



def get_info(url):
    res=requests.get(url,headers=headers)
    if res.status_code==200:
        selector=etree.HTML(res.text)
        infos=selector.xpath('//tr[@class="item"]

最低0.47元/天解锁文章

关注

0
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

captainNYS CSDN认证博客专家 CSDN认证企业博客

码龄7年

38: 原创

14万+: 周排名

189万+: 总排名

4万+: 访问

: 等级

844: 积分

30: 粉丝

30: 获赞

9: 评论

35: 收藏

私信

关注

分类专栏

java 9篇
mysql 19篇
前端 4篇
GitHub 3篇
爬虫 3篇
算法 1篇
计算机网络 4篇
JVM 7篇
数据库
DL 1篇

最新评论

吴恩达深度学习1-4（Build your neural network step by step） L_model_backword 函数
德林恩宝: 没什么意义，但按照计算方式，也算出来了
吴恩达深度学习1-4（Build your neural network step by step） L_model_backword 函数
Fake_Killer: 十分感谢！也怪我学的粗心大意，哪一层谁该乘谁写着写着就忘了，纠结了好久看到你的答案才茅塞顿开
聚集索引，非聚集索引和覆盖索引（多字段索引or复合索引）
CWY_JAVA: 666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666666
吴恩达深度学习1-4（Build your neural network step by step） L_model_backword 函数
qq_42138534: dA0 有什么意义嘛
数据库三大范式通俗讲解
Tracy-努力ing: 感谢博主的分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。