Selenium驱动firefox爬取今日头条并存放在MySQL数据库中

本文介绍了如何利用Selenium驱动Firefox浏览器爬取今日头条的内容,并将数据存储到MySQL数据库中。首先,确保安装了selenium包和MySQL数据库,同时使用Navicat作为可视化工具。接着,下载与Firefox版本兼容的geckodriver。在代码实现中,通过XPath选择新闻元素,用BeautifulSoup解析后存入数据库。
摘要由CSDN通过智能技术生成

Selenium驱动firefox爬取今日头条

前提:
1.安装selenium包:pip install selenium
2.安装MySQL数据库,并下载Navicat可视化工具
Navicat可视化工具链接:
https://pan.baidu.com/s/1xOzg2Rp9L4LVv15QmRkqbQ
提取码: 1ck5
3.下载Firefox驱动器
注意:
这里要保证Firefox、geckodriver、selenium三者的版本相互兼容,不然会出现错误或者驱动不了Firefox浏览器的情况。
这里提供一篇博客,讲述如何安装三者,保证相互兼容:
相互兼容问题

请先看源码,源码中有一些不明白的地方,在从这里查

说明资料
在这里插入图片描述在这里插入图片描述

cursor.execute('use news')

在这里插入图片描述

# SQL语句的意思是建立一个序号自增,包含title\title_pic\author\times\article_pic\article的表格
	
    sql = '''
        create table {}(
        id int(11) not null auto_increment primary key,
        title varchar(100),
        title_pic varchar(100),
        author varchar(50),
        times varchar(30),
        article_pic varchar(100),
        article text
        )
        
    '''.format(path)

    try:
        cursor.execute(sql)
    except:
        
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值