问卷:城市名 转换成 城市线:一线、新一线、二三四五线

博客讲述了在处理问卷数据过程中遇到的问题,包括列名过长、城市与区混淆、存在空格等,以及如何解决这些问题。博主制作了城市与城市线的映射字典,并统计了城市线分布,同时分析了未标注城市线的样本原因。
摘要由CSDN通过智能技术生成

导入数据

import pandas as pd
city = pd.read_excel('!202006中国城市商业魅力排行榜完整排名排名(337城市)-第一财经.xlsx')

在这里插入图片描述

# 读取问卷数据
data = pd.read_excel('微调查40899_readable (1492).xlsx')
data[['V250 -【第61题-填空题】 您居住的城市是: \n']]

在这里插入图片描述

遇到问题1:列名太长,要替换

属性(列)名太长,影响引用和阅读,要将其替换

# 将问你是来自哪个省的问题,缩减成‘省’
data.<
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值