近几天需要处理数据,遇到了字符串处理的问题,字符串是最常见的一种数据格式,但是在应用的时候才发现自己的掌握不够熟练,因此写下博客以备日后之需。
- 首先,需要注意我们学过的字符串处理方法都是针对一个“字符串”来进行的。这句话的意思是:
a="hello word!"
可以直接对a进行处理,但往往我们直接读入表格数据后数据的展现形式是这样的:这种时候需要先将想要处理的文本列拿出,再将这一列中的文本值拿出,才能一个一个进行处理。不能在列的基础上对字符串进行处理!!!
- 举个栗子
data = pd.read_excel("原始数据.xlsx")
a = data['第一列名称'].values