爬虫代码复制到Python运行,保存到MySQL

1.搜索一段爬虫代码复制到python中加入一段代码

# 定义sql语句
        sql = 'insert into douban_data values ("%s","%s","%s","%s","%s","%s","%s")' % ("num", "name", "pingfem", "mingju", "mingju", "mingju", "mingju")  #将后面括号里改为对应字段
        cursor.execute(sql)  # 执行语句
        db.commit() 

 

2、代码最后加入以下代码

# 定义数据库
# host:地址    potr:端口     user:用户名    password:密码     db:数据库名     charset:编码
db = pymysql.connect(host="localhost", port=3306, user="root", password="123456", db="douban", charset="utf8")
cursor = db.cursor() #创建游标

需要输入自己的端口和密码 

3、运行得到 

 

4、想获得更多数据

换掉Cookie码 

 cookie码需要去原网页

*右键打开检查

*点网络处

*ctrl+R刷新纪录,复制cookie码

操作详情可看:浏览器提取和输入网页cookies的方法 - 洪雨 - 博客园 (cnblogs.com) 

5、连接数据库 

#orient = 'records', 表示将DateFrame的数据转换成我想要的json格式
data_json = df.to_dict(orient='records')

for dt in data_json:
    print(dt)
    sql = 'insert into douban_data values ("%s","%s","%s","%s","%s","%s","%s")' % (dt['页码'], dt['评论者昵称'], dt['评论星级'], dt['评论时间'], dt['评论者IP属地'], dt['有用数'],dt['评论内容'])
    cursor.execute(sql)  # 执行语句
    db.commit()

 

6、创建数据表 

 

 

改掉代码中charset="utf8mb4"与navicat对应

 

最大爬取页为1

 

7、运行代码,表格自动填写

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值