获取URL中的一级域名

这段代码演示了如何使用Python从URL中提取一级域名。函数get_second_level_domain接收一个URL作为参数,返回该URL的一级域名。如果URL不规范,则返回空。
摘要由CSDN通过智能技术生成

关于一级域名的含义请自行查询,这里不再详述

下面直接上代码

#! /usr/bin/env python 

# -*- coding: UTF-8 -*-
'''
Created on 2015-10-15


@author: WFJ
'''


import re
import urlparse
import traceback

#这是国家级域名后缀字符串,如果有新增加,请按照“后缀-说明"的格式添加
country_domain_names = """ad-Andorra安道尔
ae-United Arab Emirates阿联酋
af-Afghanistan阿富汗
ag-Antigua and Barbuda安提瓜和巴布达
ai-Anguilla安圭拉
al-Albania阿尔巴尼亚
am-Armenia亚美尼亚
an-Netherlands Antilles荷兰属地
ao-Angola安哥拉
aq-Antarctica南极洲
ar-Argentina阿根廷
as-American Samoa东萨摩亚
at-Austria奥地利
au-Australia澳大利亚
aw-Aruba阿鲁巴
az-Azerbaijan阿塞拜疆
ba-Bosnia Herzegovina波黑
bb-Barbados巴巴多斯
bd-Bangladesh孟加拉
be-Belgium比利时
bf-Burkina Faso布基纳法索
bg-Bulgaria保加利亚
bh-Bahrain巴林
bi-Burundi布隆迪
bj-Benin贝宁
bm-Bermuda百慕大
bn-Brunei Darussalam文莱
bo-Bolivia玻利维亚
br-Brazil巴西
bs-Bahamas巴哈马
bt-Bhutan不丹
bv-Bouvet Island布韦岛
bw-Botswana伯兹瓦纳
by-Belarus白俄罗斯
bz-Belize伯利兹
ca-Canada加拿大
cc-Cocos Islands科科斯群岛
cf-Central African Republic中非
cg-Congo刚果
ch-Switzerland瑞士
ci-Ivory Coast象牙海岸
ck-Cook Islands库克群岛
cl-Chile智利
cm-Cameroon喀麦隆
cn-China中国
co-Colombia哥伦比亚
cq-Equatorial Guinea赤道几内亚
cr-Costa Rica哥斯达黎加
cu-Cuba古巴
cv-Cape Verde佛得角
cx-Christmas Island圣诞岛(英属)
cy-Cyprus塞浦路斯
cz-Czech Republic捷克
de-Germany德国
dj-Djibouti吉布提
dk-Denmark丹麦
dm-Dominica多米尼加联邦
do-Dominican Republic多米尼加
dz-Algeria阿尔及利亚
ec-Ecuador厄瓜多尔
ee-Estonia爱沙尼亚
eg-Egypt埃及
eh-Western Sahara西萨摩亚
es-Spain西班牙
et-Ethiopia埃塞俄比亚
ev-El Salvador萨尔瓦多
fi-Finland芬兰
fj-Fiji斐济
fk-Falkland Islands福克兰群岛
fm-Micronesia密克罗尼西亚
fo-Faroe Islands法罗群岛
f
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值