python提取国家名称缩写_pycountries:转换国家名称(可能不完整!)国家代码

我试图使用pycountries库将国家名称数据列表转换为ISO3166国家代码(alpha3)。我的基本功能是:import pycountries as pc

def guess_country(data, output='alpha3', verbose=False):

#Check Data isn't already in Alpha3

try:

country = pc.countries.get(alpha3=data)

return country

except:

pass #KeyError Raised, data doesn't directly match

#Check if Country is Actual CountryName

try:

country = pc.countries.get(name=data)

return country

except:

pass #KeyError Raised, data doesn't directly match

#Check RegExpr of 'data' in an attempt to match

问题是CountryName的数据相当脏。。。一份简短的样品清单是

GUATMAL,中国T,哥伦比亚,墨西哥,HG KONG

有人知道是否有一个包返回给定cntry_名称的最佳“guess”匹配吗?我很高兴有人因为困难而被拒绝(即中国台湾)。如果最好的猜测返回一个关于“猜测”的确定性度量,那就太好了。在

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值