python输入城市名称_python - 使用熊猫一次将多个城市名称格式化为每个城市的通用名称 - 堆栈内存溢出...

将所有城市名称更改为一个通用名称。

City b c

0 New york 1 1

1 New York 2 2

2 N.Y. 3 3

3 NY 4 4

他们称其为纽约市,但是python将它们视为独立的实体,因此我将其全部更改为一个。

df["City"] = df["City"].replace({"N.Y.":"New york", "New York": "New york", "NY": "New york"})

在此之后,我需要检查是否涵盖了纽约的所有变化,为此我创建了一个函数

def universal_ok(universal_name):

count = 0

for c in df.City:

if c == universal_name:

count += 1

# This only works when column consists of only one type of city

if count == len(df.City):

return "Yes all names are formatted correctly"

else:

return f"there are {len(df.City) - count} names that need to be changed"

universal_ok("New york")

但是问题是当一列中有多个城市时该怎么办

City b c

0 New york 1 1

1 New York 2 2

2 N.Y. 3 3

3 NY 4 4

4 Toronto 3 2

5 TO 3 2

6 toronto 3 2

有没有办法将每个城市更改为通用名称?

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值