数据清洗1
LEFT /RIGHT/MID 从什么地方开始截取的
结构类似 用left为例
第二个位置要指定的是返回的字符数量
使用问题
当返回的是2字节的时候,对于只想返回薪资下限的,因为有的是两位有的是一位,所以不能直接指定所需的字节
此时通过FIND()确定上下限的范围,就是通过查找指定字节所在的位置
然后通过查找定位到的字母从而确定下限
Concatenate 作为拼接多项的时候
& 作为简单拼接的时候使用
当想要进行多项拼接的时候
“-” 字符串的相减实现
也是四个参数,最后的一个是限定修改次数
注意本质是匹配前后
REPLACE 作为替换字符串
可以看到有四个参数
老文本,起始,修改数,新文本
这个函数一般是用作精细替换,通过控制参数,实际大的方面与替换功能(tip1中)相同
关联匹配函数
关联恢复 vlookup
非常需要注意的是,在选择要查找范围的区域中,第一列必须就是要对应查找的列
Lookup函数
当需要查询一行或一列并查询一行或一列中相同位置的值时
主要是两种形式:
两个文章归纳的一些小点:
lookup函数和vlookup_LOOKUP函数与VLOOKUP函数
对于数据不够干净的需要做处理有两个小进阶的函数
index
“数组概念”
一般多用第一个形式: 数组(允许多维),行,列
match
MATCH(lookup_value, lookup_array, [match_type])
MATCH 函数语法具有下列参数:
-
lookup_value 必需。 要在 lookup_array 中匹配的值。 例如,如果要在电话簿中查找某人的电话号码,则应该将姓名作为查找值,但实际上需要的是电话号码。
lookup_value 参数可以为值(数字、文本或逻辑值)或对数字、文本或逻辑值的单元格引用。 -
lookup_array 必需。 要搜索的单元格区域。
-
match_type 可选。 数字 -1、0 或 1。 match_type 参数指定 Excel 如何将 lookup_value 与 lookup_array 中的值匹配。 此参数的默认值为 1。(当为0的时候,只会返回第一个)
实际使用的时候,多将index与match进行组合使用
通过match进行返回出来理想值的位置,然后再看是作为列还是行进行查找(实现的功能类似于vlookup)
补充:offset函数,返回的是偏移量,结合使用一般不会单独。
“行标号列标号”
row函数--返回单元格在第几行
随机抽样中,随机抽查百分之多少这个比例的数据时,先使用row函数,相当于对每一行前面有一个标号,再通过筛选进行抽取。
column函数--返回的是列号
了解,因为数据一般都是横向排布
小内容
tip1:(替换)
注意到并不是都可以进行搜索成功
这是因为大小写格式并没有规范,通过替换进行简单的清洗
tip2:快速将下面整列的填充相同的函数
Ctrl+Shift+下键:可以向下全部选中整列
或者是对着那个底部的小方框双击即可
tip3: 文本格式转化
有个函数是text,TEXT 函数可通过 格式代码 向数字应用格式,进而更改数字的显示方式,一般是进行转化为时间,但是有直接在单元格属性中做修改更为方便。
tip3:处理一些原始数据中的空格项
TRIM函数主要用于把单元格内容前后的空格去掉,但并不去除字符之间的空格。 如果单元格中有从其他程序中获得带有不规则空格的文本是,可以使用TRIM函数。
注意,英文本身单词间隔不会消去