python爬虫获取数据后存入MySQL数据库中

最新推荐文章于 2024-08-12 15:08:41 发布

迷迭香迷魂香

最新推荐文章于 2024-08-12 15:08:41 发布

阅读量1.3w

点赞数 5

分类专栏： python 文章标签： python mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36185831/article/details/79123271

版权

python 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

from urllib.request import urlopen
import re
import numpy
import time
import pymysql
from bs4 import BeautifulSoup

def getHtmlContent(url):
    html = urlopen(url)
    bsobj = BeautifulSoup(html,"lxml",from_encoding = "gb18030")
    tablelist = bsobj.findAll("tr")

    #用户名：root 密码：123456 数据库名：aqi-changsha
    db = pymysql.connect("localhost","root","123456","aqi-changsha",charset="utf8")
    cursor = db.cursor()
    
    date = time.strftime('%Y-%m-%d %H:%M:%S',time.localtime(time.time()))#获取当前时间
    date1 = ("insert into date values (%s)")
    try:
        cursor.execute(date1,date)
        db.commit(); #提交操作
    except:
        db.rollback();
        
    for datalist in tablelist[1:]:
        data = datalist.get_text().replace(" ","").replace("\r\n","").strip("\n").split("\n")
        data.append(date)
        data.append("0")
        try:
            insert_data = ("insert into aqi values (%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)")
            cursor.execute(insert_data,data)
            db.commit();
        except:
            db.rollback()
          
    db.close()
    
def main():
    url = "http://www.tianqihoubao.com/aqi/changsha.html"
    getHtmlContent(url)
  
if __name__ == "__main__":
    main()

迷迭香迷魂香

关注

5
点赞
踩
41

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

迷迭香迷魂香 CSDN认证博客专家 CSDN认证企业博客

码龄8年

28: 原创

31万+: 周排名

65万+: 总排名

10万+: 访问

: 等级

835: 积分

16: 粉丝

18: 获赞

17: 评论

101: 收藏

私信

关注

热门文章

分类专栏

设计模式 1篇
数据库 5篇
大数据与AI 1篇
python 2篇
ubuntu 1篇
工具使用 2篇
算法 4篇
pat 7篇
antlr 1篇
powerDesigner 1篇
tomcat 1篇
leetcode 2篇
Java Web 5篇
Java 3篇

最新评论

五位数电话号码以及中国各市区号
迷迭香迷魂香: 那要补充的还有挺多的
五位数电话号码以及中国各市区号
RC47YUI6: 很好，不过给你补充下，竟然没有12306
一个简单的python爬虫
yyxm123: 博主，可以将主函数的代码完整给出吗
mysql 按照天数进行查询，并补全没有的日期
迷迭香迷魂香: 代码里补全，类似这样[code=java] private String[] getDateArr(String startDate,String endDate){ int len = DateUtil.daysBetween(DateUtil.stringToDate(startDate, PATTERN), DateUtil.stringToDate(endDate, PATTERN)) + 1; String[] dateArr = new String[len]; Calendar cal = Calendar.getInstance(); cal.setTime(DateUtil.stringToDate(startDate,PATTERN)); for(int i = 0;i < len;i++){ dateArr[i] = DateUtil.dateToString(cal.getTime(),PATTERN); cal.add(Calendar.DATE, 1); } return dateArr; } [/code]
mysql 按照天数进行查询，并补全没有的日期
QianJiangXiaomo: 我也遇到同样的问题，数量被右链接表限制了，目前你那边有更好的解决方案吗？

大家在看

聚类算法| DBSCAN 密度聚类算法（Matlab源代码，聚类结果可视化） 557

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。