Python网络爬虫使用BeautifulSoup爬取网页内容并存入数据库案例

最新推荐文章于 2024-05-12 16:44:53 发布

sone_pzk

最新推荐文章于 2024-05-12 16:44:53 发布

阅读量3.7k

点赞数 16

文章标签： mysql python 数据分析数据库大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_43606442/article/details/103547561

版权

使用BeautifulSoup爬取网页内容并存入数据库案例

学习了Python网络爬虫，完成里一个比较完整的爬虫案例与大家分享

爬取地址：http://www.tipdm.com/cpzx/index.jhtml
任务：爬取网页中产品中心的小标题、简介、超链接，存入数据库
数据库使用的是Mysql，直接使用代码创建数据库数据表以及插入数据

长篇短写，代码如下：

import requests
import pymysql
from bs4 import BeautifulSoup


def get_html_text(url):
    headers = {
   
        'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/76.0.3809.87 Safari/537.36'
    }
    html_resutl = requests.get(url=url, headers=headers)
    return html_resutl.text


def get_title_link_intro(html_text_list):
    result_list = list()
    for i in range(len(html_text_list)):
        result_bs = BeautifulSoup(html_text_list[i],'lxml')
        search_con = result_bs.select('#t248 > div > div.con')
        for i_con in search_con:
            result_list.append([])
            result_list[len(result_list) - 1].append(i_con.select('h1>a'

最低0.47元/天解锁文章

关注

16
点赞
踩
58

收藏

觉得还不错? 一键收藏
4
评论
Python网络爬虫使用BeautifulSoup爬取网页内容并存入数据库案例

使用BeautifulSoup爬取网页内容并存入数据库案例学习了Python网络爬虫，完成里一个比较完整的爬虫案例与大家分享爬取地址：http://www.tipdm.com/cpzx/index.jhtml任务：爬取网页中产品中心的小标题、简介、超链接，存入数据库数据库使用的是Mysql，直接使用代码创建数据库数据表以及插入数据长篇短写，代码如下：import requestsim...
复制链接

扫一扫

sone_pzk CSDN认证博客专家 CSDN认证企业博客

码龄6年

8: 原创

52万+: 周排名

211万+: 总排名

5万+: 访问

: 等级

645: 积分

75: 粉丝

74: 获赞

36: 评论

493: 收藏

私信

关注

热门文章

分类专栏

信用卡实训 2篇

最新评论

数据库（SQL Sever）水平证书复习题
TGCF——无所事事: 单选题第16~30题答案【答案仅供参考】： 16.D 17.C 18.B 19.D 20.A 21.A 22.C 23.C 24.D 25.D 26._ 27.D 28._ 29.A 30.D
数据库（SQL Sever）水平证书复习题
TGCF——无所事事: 单选题第1~10题答案【答案仅供参考】： 1.D 解析-数据库系统是数据库、硬件、软件和数据库管理员（DBA ）的集合体 2.D 解析-数据模型通常由数据结构、数据操作和数据的完整性约束条件三部分组成。不属于数据模型组成要素的是数据共享性 3.C 解析-目前应用最为广泛的数据模型是关系数据模型 4.A 解析-数据库管理系统中数据操纵语言DML所实现的操作一般包括查询、插入、修改、删除 5.A 解析-数据库的每张表只能有一个主键，不可能有多个主键。 6.D 解析-外键表示了两个关系之间的联系 7.C 解析-在 SQL 语言中使用 FOREIGN KEY 时，与之配合的语句是REFERENCES 8.B 解析-下列选项中，可能会违反实体完整性的是DROP 9.B 解析-SQL 语言中，SELECT 语句的执行结果是表 10.C 解析-varchar和char的区别之一：定长和变长在MySQL中，char和varchar都是用来存储字符串的，区别在于char有固定的长度，而varchar属于可变长的字符类型 11.A 解析-"_ "与任意单字符匹配 ,"%" 与包含一个或多个字符的字符串匹配,"[ ]" 与特定范围中的任意单字符匹配。 12.C 解析-字符串函数 (Transact-SQL)包括LEFT 13.D 解析-MAX函数返回表达式中的最大值，可以用于数字型，字符型及日期、时间类型的列。 14.B 解析-无 15.A 解析-SQL的SELECT命令中，COUNT ( [DISTINCT] 字段名)表示统计COUNT函数的字段中所有不重复值的记录数。
大数据之Python数据分析实训航空公司客户价值分析之二、使用 K-Means 算法进行客户分群
linkunyu22699: 请问怎么看哪个用户属于哪个类别啊
数据库（SQL Sever）水平证书复习题
owlhh33: 蹲答案球球了
数据库（SQL Sever）水平证书复习题
Huang_JW5: 作者能给个答案对一对吗

大家在看

最新文章

目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。