目录
课程来源:《秦路七周数据分析》
一、文本清洗
- 工具:excel
- 8个文本清洗函数:find, substitute, left/ right/ mid, text, concatenate, trim, replace, len
1. find:查找位置 & left/ right/ mid:截取文本
示例:寻找工资12k-20k的下限
=LEFT(P2, FIND("k",P2,1)-1)
-- LEFT(文本,截取到第几位),返回从左开始截取的文本
-- FIND(查找的文本,目标文本,开始位置),返回查找文本所在位置
2. concatenate:拼接
示例:拼接n个字段
=CONCATENATE(Q2,"k","-",R2)
3. replace:替换
示例:把”应届毕业生“替换为”往届毕业生“
=REPLACE(T2,1,2,"往届")
-- REPLACE(目标文本,开始位置,替换长度,替换的内容)
4. substitute:减法
示例:提取”应届毕业生“减去”应届“的部分
=SUBSTITUTE(T2, "应届","")
-- SUBSTITUTE(目标文本,被替换的内容,替换的内容)
5. trim:删除字符串多余空格
=TRIM(R2)
-- 删除左右的空格,中间的保留
6. len:计算字符长度
=LEN(R3)
-- 删除左右的空格,中间的保留
二、关联匹配
- 工具:excel
- 8个关联匹配函数:lookup, vlookup, index, match, row, column, offset, hyperlink
1. vlookup
VLOOKUP(查找数据,查找范围,范围col,false (模糊查找) / true (精确查找)