一 ES库的使用
ES库学习
https://www.jianshu.com/p/e8ee319a238d
(一)数据转换格式
1:sys.argv 是获取运行python文件的时候命令行参数,且以list形式存储参数
2:xlrd.open_workbook打开文件
3:sheet_by_index 获取某一个表单
str.replace(old, new[, max])
old -- 将被替换的子字符串。
new -- 新字符串,用于替换old子字符串。
max -- 可选字符串, 替换不超过 max 次
4:filter(function, iterable)
- function -- 判断函数。
- iterable -- 可迭代对象。
5:lambda
https://blog.csdn.net/SeeTheWorld518/article/details/46959593
6:zip
合并为多元矩阵
7:extend
添加新列表
8:to_csv
https://blog.csdn.net/toshibahuai/article/details/79034829
9:DataFrame
创建DataFrame对象
10:list*a
重复a遍
(二)导入es库
SequenceMatcher
https://www.jianshu.com/p/9369d4ef3131
1:set()
创建一个无序不重复元素集,可进行关系测试,删除重复数据,还可以计算交集、差集、并集等。
2:strip()
移除字符串头尾指定的字符
3:选取整列
loc是根据dataframe的具体标签选取列,而iloc是根据标签所在的位置