在处理数据的时候,对数值型的数据处理还是比较方便的,但是有时候数值型数据出现问题后就会比较头痛了,因为文本数据的排列组合可是有很多很多的,今天我们就学习一下如何对文本数据进行处理,这样我们接下来在工作中遇到了这些情况就可以少掉一下头发啦。
一、str属性
文本数据也就是我们常说的字符串,pandas为series提供了str属性,通过它可以方便对每个元素进行操作。
为了防止数据被弄坏,我们先预留一个备份以防万一。
这里我们是不能使用backup_user_info = user_info的因为这样的话一个更改另外一个也会更改。
在之前我们也已经了解过,在对series中每个元素处理时,我们可以使用map或apply方法,比如我们想把星球列下面的地球和外星转换为英文,可以使用下面的方式。
这时候我们在将表恢复成原来的样子。
- 将哪个星球列下的星球改为大写的