【mysql数据库】通过python 3.7 爬虫获取企查查公开的企业信息，并记录到数据库

最新推荐文章于 2023-10-18 11:34:18 发布

工匠小能手

最新推荐文章于 2023-10-18 11:34:18 发布

阅读量8.2k

点赞数 2

分类专栏： Python网络爬虫 mysql数据库

本文链接：https://blog.csdn.net/qq_39295735/article/details/84504848

版权

1、爬虫的思路参考这篇博文

https://mp.csdn.net/postedit/83628587

2、数据库保存截图如下

3、python代码如下

#!/usr/bin/python3
#-*- coding: utf-8 -*-

import urllib.request
import re
import pymysql

#记录公司信息的字典，类似C语言的结构体
#字典中的字段包括：company,domain,legal_person,address,email,phone
gCompanyInfo = dict()

#伪装爬虫成浏览器
def spider2browser():
    headers=("User-Agent","Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/38.0.2125.122 Safari/537.36 SE 2.X MetaSr 1.0")
    opener = urllib.request.build_opener()
    opener.addheaders = [headers]
    urllib.request.instal

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

工匠小能手

关注关注

2
点赞
踩
29

收藏

觉得还不错? 一键收藏
9
评论
【mysql数据库】通过python 3.7 爬虫获取企查查公开的企业信息，并记录到数据库

1、爬虫的思路参考这篇博文https://mp.csdn.net/postedit/836285872、数据库保存截图如下3、python代码如下#!/usr/bin/python3#-*- coding: utf-8 -*-import urllib.requestimport reimport pymysql#记录公司信息的字典，类似C语言的结构体#字典中...
复制链接

扫一扫