import pandas as pd
df = pd.DataFrame({'name':["test_1", "test_2"]})
字符串处理之split
问题1:将name列拆为两列
df['name'].str.split('_', expand=True)
这样返回一个DataFrame结构,如果未设置expand,返回时一个Series结构。
字符串处理之extract
问题2:提取name列中的数字
df['name'].str.extract('(\d)', expand=True)
df['name'].str.extract('(\d+)', expand=True)
df['name'].str.extract('test_(\d+)', expand=True)
df['name'].str.extract('([a-z]+)', expand=True)