jupyter字符串操作

最新推荐文章于 2022-04-14 22:21:01 发布

zz神君

最新推荐文章于 2022-04-14 22:21:01 发布

阅读量2.1k

点赞数

分类专栏： jupyter 文章标签： jupyter python 机器学习

本文链接：https://blog.csdn.net/weixin_43808138/article/details/123554063

版权

jupyter 专栏收录该内容

10 篇文章 4 订阅

订阅专栏

本文介绍了使用Python的pandas库进行数据处理的各种操作，包括字符串替换、包含检查、大小写转换、数据分割以及函数映射等。通过实例展示了如何进行列累加、计算最大值与最小值的差以及元素级别的方法应用。这些技巧在数据分析中非常实用。

摘要由CSDN通过智能技术生成

import pandas as pd
import numpy as np
data = pd.DataFrame({'k1':['beijing,haidian,chushou','beijing,chaoyang,chushou','beijing,fengtai,chuzu'] ,'k2': ['beijing,xicheng,chuzu','beijing,shijingshan,chushou',np.nan]})
data

在这里插入图片描述

替换

data.k2.str.replace('beijing','shanghai')#将K2中的beijing替换为shanghai

在这里插入图片描述

包含

data.k1.str.contains('chushou')

在这里插入图片描述

data[data.k1.str.contains('chushou')]

在这里插入图片描述

data.k2.str.upper() #大写

在这里插入图片描述

分割

data.k2.str.split(',')#将字符串分离
data.k2.str.split(',')[0][0]
data.k1.str[:6]

在这里插入图片描述

函数映射来转换数据

用于series的map方法接受一个函数，或是一个字典，包含着映射关系，但这里有一个小问题，有些值是大写，有些是小写。因此，我们先用str.lower把所有的值变为小写:

quyu_to_chengshi = {
    'chaoyang': 'beijing',
    'huangpu': 'shanghai',
    'jingan': 'shanghai',
    'haidian': 'beijing',
    'fengtai': 'beijing',
    'tongzhou': 'beijing'
}
quyu_to_chengshi

在这里插入图片描述

data = pd.Series(['chaoyang','jingan','huangpu','jingan','fengtai','jingan','tongzhou','haidian','jingan'])
data

在这里插入图片描述

data.map(quyu_to_chengshi)#map只能应用于Series 将data里的区根据quyu_to_chengshi映射替换成城市

在这里插入图片描述

data.map(lambda x:x.upper())#将lambda x（为一个函数）：自变量x(为元素)中的所有字符都变成大写。

在这里插入图片描述

data =pd.DataFrame(np.random.randn(5,4),columns=list('abcd'))
data

在这里插入图片描述

data.apply(np.cumsum,axis =1) #列累加

在这里插入图片描述

data.apply(lambda x:x.max() - x.min()) #在列上应用

在这里插入图片描述
元素级别的方法

data.applymap(lambda x: x+100)

在这里插入图片描述

zz神君

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录