pandas string funcs

最新推荐文章于 2024-10-08 12:37:10 发布

Claroja

最新推荐文章于 2024-10-08 12:37:10 发布

阅读量149

点赞数

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/claroja/article/details/108056565

版权

Python 专栏收录该内容

398 篇文章 5 订阅

订阅专栏

基本函数

s = pd.Series(['A',' B'])
s.str.lower()
s.str.upper()
s.str.len()
s.str.strip()
s.str.lstrip()
s.str.rstrip()

split

s = pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])
s.str[1] # 取所有列下标为1的字符
s.str.split('_').str[1] # 将所有字符串拆分，然后去下标为1的字符
s.str.split('_', expand=True) # 将拆分后的字符串，变成数据框

repalce

s = pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])
s.str.replace('_._','_')

Concatenation

1）聚合拼贴字符串

s = pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])
s.str.cat(sep=',')

2）和其他序列进行拼贴

s = pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])
u = pd.Series(['b', 'd', 'a', 'c'], index=[1, 3, 0, 2])
s.str.cat(u, join='left')

Extracting

extract只返回分组内容

>>> pd.Series(['a1', 'b2', 'c3']).str.extract(r'([ab])(\d)') 
     0    1
0    a    1
1    b    2
2  NaN  NaN
>>> pd.Series(['a1', 'b2', 'c3']).str.extract(r'[ab](\d)')               
     0
0    1
1    2
2  NaN

contains

用来判断是否包含字符

pd.Series(['1', '2', '3a', '3b', '03c', '4dx']).str.contains(r'[0-9][a-z]')

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Claroja

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

成功解决AttributeError: module ‘pandas.core.strings‘ has no attribute ‘StringMethods‘

近期请国内外头部出版社可尽快私信博主！——心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，谦虚，自律，反思，成长，还算是比较正能量的博主，公益免费传播……内心特别想在AI界做出一些可以推进历史进程影响力的东西(兴趣使然，有点小情怀，也有点使命感呀)…

06-05

1251

成功解决AttributeError: module 'pandas.core.strings' has no attribute 'StringMethods' 目录解决问题解决方法解决问题 AttributeError: module 'pandas.core.strings' has no attribute 'StringMethods' 解决方法第一次尝试，猜测pandas和dask不兼容的问题导致！ pip uninstall pandas pip uninstall

pandas小知识：字符串转datetime格式

qq_46580042的博客

09-07

1424

两种方法：方法一：使用datetime.strptime() value = '2021-09-07' datetime.strptime(value, '%Y-%m-%d') # 结果 datetime.datetime(2021, 9, 7, 0, 0) # 这样就可以通过.year .month获取年、月方法二：使用第三方包dateutil的parser.parse方法注意：这个包在安装pandas时已经自动安装 from dateutil.parser import parse valu

参与评论您还未登录，请先登录后发表或查看评论

pandas string方法 str.contain/lower/replace

shineLikeTheSun的博客

10-10

931

lower() df['name'].str.lower() #str是一个accessor，取到name列的每个元素并将他们变为小写形式可以用apply()函数代替，你可以尝试写一写。结合使用 df['name'].str.split(',').str.get(0) #取到name列的每个元素并使用，分割，取到第一个元素 contain() filt=df['name‘].str.contains('Countess') #对name列的每个元素判断其是否包含Countess字符.

pandas DateTime funcs

Claroja

08-18

108

查看对应对象方法 pandas.Timestamp pandas.Timedelta

pandas_排序function

sinat_20263049的博客

09-04

271

import pandas as pd df=pd.read_csv('dataAnalyst_sql.csv') df.info() #查询表格信息 <class 'pandas.core.frame.DataFrame'> RangeIndex: 5031 entries, 0 to 5030 Data columns (total 12 columns): posi...

pandas中的字符串处理函数

庐州月光的博客

07-04

1879

欢迎关注”生信修炼手册”!在pandas中，通过DataFrame来存储文件中的内容，其中最常见的数据类型就是字符串了。针对字符串，pandas提供了一系列的函数，来提高操作效率。这些函...

Pandas常用函数总结（二）

qq_24193303的博客

03-05

351

接上篇Pandas常用函数总结（1），本篇继续介绍Pandas常用的函数。首先介绍下Pandas里面常用的两种数据类型，一种是Series,类似一维数组；还一种是DataFrame，类似二维数组。三、apply（）函数 apply函数是pandas里面所有函数中自由度最高的函数。该函数如下： DataFrame.apply(func, axis=0, broadcast=False, raw=False, reduce=None, args=(), **kwds) 该函数最有用的是第一个参数，这

Pandas StringMethods概述

EverYang

03-14

1643

Pandas StringMethods概述一、实验数据构建假定有一个表如大学招生表，包括c -> colCode(大学代码),f -> firstSubject(首选科目),o -> otherSubject(其他科目要求),t -> total(评估总分), l -> location(所在地) 等五列数据。用第一个字符作为字段名便于简要描述。在实务中，建议使用英文驼峰命名法，增加可读性。 1、用Dict构建DataFrame import numpy as np im

pandas string转dataframe的方法

12-25

当时第一反应是把dataframe分割成多块小文件处理，后面发现即使pandas内存问题解决了，用pickle做保存数据时也会提升内存不够的报错，后来把dataframe对象转化成string，发现内存占用减少了近一半。所以打算用先转...

【python】Pandas中DataFrame基本函数整理（全）

热门推荐

brucewong0516的博客

08-17

5万+

构造函数 DataFrame([data, index, columns, dtype, copy]) #构造数据框属性和数据 DataFrame.axes #index: 行标签；columns: 列标签 DataFrame.as_matrix([columns]) #转换为矩阵 Da...

pandas常用函数之str（字符串）

xfysq_的博客

04-16

1790

提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言一、DataFrame的字符串操作前言对pandas常用的函数进行了一下汇总，供自己以后回顾使用。一、DataFrame的字符串操作 contains()#是否包含 len()#字符串的长度 lower()#转换成小写字符 upper()#转换成大写字符 replace()#替换 split()#以分隔符或者正则表达式拆分 strip()#去掉空白符，包括换行符 ...

Pandas 字符串操作函数

无名小站

09-26

2295

常用的Pandas 字符串操作函数有这些：编号函数描述 1 lower() 将Series/Index中的字符串转换为小写。 2 upper() 将Series/Index中的字符串转换为大写。 3 len() 计算字符串长度。 4 strip() 帮助从两侧的系列/索引中的每个字符串中删除空格(包括换行符)。 5 split(’ ') 用给定的模式拆分每个字...

pandas入门之string与object

zhn147的博客

06-26

2969

string类型的性质 1.转换 pd.Series([1,'1.']).astype('str').astype('string') 2.拆分str.split s.str.split('_').str[1] 3.拼接str.cat

从pandas中的这几个函数，我看懂了道家“一生二、二生三、三生万物”

简说Python的博客

05-28

734

导读pandas是用python进行数据分析最好用的工具包，没有之一！从数据读写到预处理、从数据分析到可视化，pandas提供了一站式服务。而其中的几个聚合统计函数，不仅常用更富有辩证思...

pandas-自定义函数的使用

咸鱼!!!

08-08

4699

pandas自定义函数的使用排序数据重构数据连接操作自定义函数的使用 import numpy as np import pandas as pd # todo 将自定义的函数作用到dataframe的行和列或者Serise的行上 ser1 = pd.Series(np.random.randint(-10,10,5),index=list('abcde')) df1 = pd.DataFr...

pandas 高级（函数与运算）

红叶谷 wsp_1138886114的博客

06-08

6243

pandas高级篇一、向量化函数操作向量化函数应用 -map(变换数据和创造新变量) map是作用在 Series 上，是元素级别操作 Series.map(arg,na_action=None) arg可以是一个函数，对元素做函数变换也可以是一个dict、series 对元素做数据映射向量化函数应用 -applymap applymap 是作用在 dat...

python中zip()与zip(*)的用法解析