Numpy字符操作 2018/11/20
===================================================================================
1.函数
No | 函数 | 说明 | |
1 | add() | 返回两个str或Unicode数组的逐个字符串连接 | |
2 | capitalize() | 返回给定字符串的副本,其中只有第一个字符串大写 | |
3 | center() | 返回给定字符串的副本,其中元素位于特定字符串的中央 | |
4 | decode() | 按元素调用str.decode | |
5 | encode() | 按元素调用str.encode | |
6 | join() | 返回一个字符串,它是序列中字符串的连接 | |
7 | lower() | 返回一个数组,其元素转换为小写 | |
8 | multiply() | 返回按元素多重连接后的字符串 | |
9 | replace() | 返回字符串副本,所有子字符串的出现位置都被新字符串取代 | |
10 | split() | 返回字符串中的单词列表,并使用分隔符来分割 | |
11 | splitlines() | 返回元素中的行列表,以换行符分割 | |
12 | strip() | 返回数组副本,其中元素移除了开头或者结尾处的特定字符 | |
13 | title() | 返回字符串或 Unicode 的按元素标题转换版本 | |
14 | upper() | 返回一个数组,其元素转换为大写 |
# 以下函数用于对dtype为string_或unicode_的数组执行向量化字符串操作。
# 基于 Python 内置库中的标准字符串函数。
===================================================================================
2.实例
np.char.add(['hello'],[' word']) #字符串连接array(['hello word'], dtype='<U9')
np.char.multiply('Hello ',3) #多重连接 array('Hello Hello Hello ', dtype='<U18')
np.char.center('hello', 20,fillchar = '*')#填充字符 array('*******hello********', dtype='<U20')
np.char.capitalize('hello world') #首字母大写 array('Hello world', dtype='<U11')
np.char.title('hello how are you?') # 标题 array('Hello How Are You?', dtype='<U18')
np.char.lower(['HELLO','WORLD']) #小写 array(['hello', 'world'], dtype='<U5')
np.char.upper(['hello','world']) #大写 array(['HELLO', 'WORLD'], dtype='<U5')
np.char.split ('Tom,Bob,John', sep = ',')
# 分割字符串 array(list(['Tom', 'Bob', 'John']), dtype=object)
np.char.splitlines('hello\nhow are you?')#换行符分割字符串 '\n','\r','\r\n'都会用作换行符。
# array(list(['hello', 'how are you?']), dtype=object)
np.char.splitlines('hello\rhow are you?') #array(list(['hello', 'how are you?']), dtype=object)
np.char.strip(['aTom','admin','java'],'a') #移除开头或结尾特定字符array(['Tom', 'dmin', 'jav'], dtype='<U5')
np.char.join(':','dmy') #单个字符由特定的分隔符连接 array('d:m:y', dtype='<U5')
np.char.join([':','-'],['dmy','ymd']) #array(['d:m:y', 'y-m-d'], dtype='<U5')
'.'.join(['ab', 'pq', 'rs']) # 'ab.pq.rs'
''.join(['ab', 'pq', 'rs']) # 'abpqrs'
np.char.replace ('He is a boy', ' is', "'s") #array("He's a boy", dtype='<U10')
b=np.char.encode('hello', 'cp500') #字符串编码 array(b'\x88\x85\x93\x93\x96', dtype='|S5')
np.char.decode(b,encoding='cp500') #array('hello', dtype='<U5')
#str.encode 默认编码utf_8可用标准 Python 库编解码器。
=====================================================================================