前言:本文是学习网易微专业的《python全栈工程师》 中的《数据分析 - 机器学习工程师》专题的课程笔记,欢迎学习交流。
一、课程目标
- 掌握矢量化字符串的常用方法
二、详情解读
2.1.矢量化
- 将序列类对象转化为
Series
类
–Series
的str
属性
– 避免循环语句
– 对字符串的处理能力更强
2.1.1.矢量化字符串
必要性:
将列表中字符串首字母大写
names = ['newton', 'hertz', 'curie']
[name.capitalize() for name in names]
运行结果:
但是,当列表中有缺失值None
时,上述的方法将不再适用,下面的操作会报错:
names2 = ['newton', 'hertz', None, 'curie']
[name.capitalize() for name in names2]
解决方案:将列表转化为Series
对象,即将其矢量化。
import pandas as pd
# 矢量化
snames = pd.Series(names2)
snames
运行结果: