Requests 学习应用-行政区划代码获取

Requests 学习应用-行政区划代码获取

  1. 获取
  2. 解析
  3. 数据整理

1. 获取

这个网址的原始界面长这样)
在这里插入图片描述

import requests as re
from bs4 import BeautifulSoup
import pandas as pd
url='http://www.mca.gov.cn/article/sj/xzqh/2020/2020/2020112010001.html'#民政部行政区划代码的页面
r=re.get(url)
r.status_code
print(r.text)

在这里插入图片描述

2. 解析

soup=BeautifulSoup(r.text,'lxml')
print(soup)

在这里插入图片描述

print(soup.get_text())

在这里插入图片描述

3.数据整理

#将地区和行政区划分码分成两个lst 
i=1
lst1=list()
lst2=list()
for string in soup.stripped_strings:
    if i>6:#由于行政区域数据从第7项开始,因此剔除前面内容
        if i%2==0:
            lst1.append(string)
        else:
            lst2.append(string)
    i=1+i
 print(lst1)
 print(lst2)

两个list内容分别如下
在这里插入图片描述
在这里插入图片描述

data=pd.DataFrame([lst1,lst2]).T
print(data)

![在这里插入图片描述](https://img-blog.csdnimg.cn/2021041515430075.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3Jvd2VuMDM0OA==,size_16,color_FFFFFF,t_7
清洗一下就是完整的行政区划代码啦

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值