Pandas 文本数据

本文介绍了一项关于房屋信息数据集的处理任务,包括将year列转换为整数年份,将floor列拆分为Level和Highest两列,分别表示楼层类别和最高层数,并计算房屋每平米的均价avg_price。str对象在数据处理中的应用和正则表达式的简写字符集也在讨论范围内。
摘要由CSDN通过智能技术生成

Ex1:房屋信息数据集

现有一份房屋信息数据集如下:

  • 将year列改为整数年份存储。
  • 将floor列替换为Level, Highest两列,其中的元素分别为string类型的层类别(高层、中层、低层)与整数类型的最高层数
  • 计算房屋每平米的均价avg_price,以***元/平米的格式存储到表中,其中***为整数。
    在这里插入图片描述
    在这里插入图片描述
    小结:
  1. str对象的设计意图

str对象是定义在Index或Series上的属性,专门用于逐元素处理文本内容,其内部定义了大量方法,因此对一个序列进行文本处理,首先需要获取其str对象。

  1. []索引器

对于str对象而言,可理解为其对字符串进行了序列化的操作,例如在一般的字符串中,通过[]可以取出某个位置的元素:

  1. string类型
    string类型,其引入的动机在于:原来所有的字符串类型都会以object类型的Series进行存储,但object类型只应当存储混合类型,例如同时存储浮点、字符串、字典、列表、自定义类型等,因此字符串有必要同数值型或category一样,具有自己的数据存放类型,从而引入了string类型。

在正则表达式中还有一类简写字符集,这点也是需要注意的

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值