scrapy框架循环多层页面爬取数据写入数据库或文档

本文介绍如何使用Scrapy框架,针对http://m.jihaoba.com/tools/haoduan/网站,爬取不同城市的手机号段信息,并详细说明了数据结构、存储到数据库以及保存为JSON文档的实现过程。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求

公司app有个模块,需要做手机号段检索,便于导入指定市的电话
在这里插入图片描述
参考第三方网站:http://m.jihaoba.com/tools/haoduan/

利用scrapy框架,爬取城市和号段,存入数据库,数据结构:

create table `fcxlt_fans_data`(
                                  `id` bigint NOT NULL AUTO_INCREMENT,
                                  `city_id` int(11) NOT NULL,
                                  `segment_num_3` char(3) not null ,
                                  `segment_num_7` mediumtext not null ,
                                  primary key (`id`),
                                  key `city_id` (`city_id`) using btree
) engine =innodb auto_increment=1 default  charset=utf8mb4

phones.py

# -*- coding
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值