四、基于python的字符串的处理(字符串的拆分与类型转换)

本章分享一个字符串的拆分技巧,以及字符串怎么转化为整形数据用于计算。

任务要求:将salary列数据转换为最大值与最小值的平均值

1.数据的创建

import pandas as pd
dict={"name":["小王","小明","小辉","小红","小李"],
      "education":["大专","本科","研究生","本科","本科"],
      "salary":["6k-10k","7k-9k","10k-15k","10k-12k","5k-8k"]}
df=pd.DataFrame(dict)
df

结果如下:
在这里插入图片描述

2.求解过程与技巧

两种方法:方法一简单易懂,方法二简洁高效
2.1方法一:

import re
b=[]
a=df["salary"].str.replace("k","") #此处用replace将k替换为空
for i in range(len(a)):
    b.append(re.split('-',a[i])) #split按'-'将字符串拆分

mean_salary=[]
for i in range(len(b)):
    mean_salary.append(int((int(b[i][0])+int(b[i][1]))/2*1000)) #int()将字符串转为int类型
    
dict={"mean_salary":mean_salary}
c=pd.DataFrame(dict)
df=pd.concat([df,c],axis=1)
df.drop("salary",axis=1)

结果显示:
在这里插入图片描述2.2方法二:

import re
# :apply + 自定义函数
def func(df):
    lst = df['salary'].split('-')
    smin = int(lst[0].strip('k'))
    smax = int(lst[1].strip('k'))
    df['salary'] = int((smin + smax) / 2 * 1000)
    return df
df = df.apply(func,axis=1)

结果显示:
在这里插入图片描述总结一下:方法二优势明显,需要熟练掌握apply的运用以及函数的定义;
方法一中的一些函数也常用,对于数据分析必须掌握,如:replace、split和int类型的转化,字典转DataFrame等

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值