知识代码
list1 = [1, 2, 3, 4, 5, 6, 7, 8, 9]
# 增
list1.append(200)
# 删
del list1[1]
list1.remove(3)
# 改
list1[0] = 100
# 查
print(list1[2::2])
# 遍历
for item in list1:
print(item)
dict1 = {'学号': '001', '姓名': '张三', '年龄': 18}
list1 = ['a', 'b', 'c','d']
list2 = [1, 2, 3]
dict2 = dict(zip(list1, list2))
print(dict2)
# print(dict2['a1'])
print(dict2.get('a1'))
dict2['a'] = 100
for item in dict2.items():
print(item)
for item in dict2.keys():
print(item)
for k,v in dict2.items():
print(k,v)
a = '1'
print(a)
函数
# 函数
def pre_deal():
pass
a = 1
b = 2
def func_sum(para1, para2):
res = para1 + para2
return res
value = func_sum(a,b)
print(value)
demo3
# 函数
def pre_deal():
pass
def func_sum(para1, para2):
res = para1 + para2
return res
if __name__ == '__main__':
a = 1
b = 2
value = func_sum(a, b)
print(value)
案例实战
案例一:
ETL开发工程师,3-7年,本科以上,13000-25000,北京中软国际信息技术有限公司,40.3万次浏览,,北京
ETL开发工程师,2年经验,不限学历,1.2-1.8万/月,东华软件股份公司,20.7万次浏览,,北京
用Python语言实现上述两条信息规范化,进行函数封装
1、读取字符串进行拆分,替代
2、针对于经验规范化枚举类型:[0,2]、(3,5]、5年以上
3、规范化薪资求平均薪资
4、规范化浏览量成数值
def data_standard():
data = load_data()
for line in data:
line_standard(line)
# 数据加载
def load_data():
line1 = 'ETL开发工程师,3-7年,本科以上,13000-25000,北京中软国际信息技术有限公司,40.3万次浏览,,北京'
line2 = 'ETL开发工程师,2年经验,不限学历,1.2-1.8万/月,东华软件股份公司,20.7万次浏览,,北京'
data = []
data.append(line1)
data.append(line2)
return data
# 单行数据标准化处理
def line_standard(line):
# 【1】针对数据解析
line = line.replace(',', ',')
line_list = line.split(',')
exp = line_list[1]
salary = line_list[3]
hit = line_list[5]
# 【2】处理经验数据
exp_new = deal_exp(exp)
# 【3】处理薪资数据
salary_avg = deal_salary(salary)
# 【4】处理点赞量
hit_new = deal_hit(hit)
# 【5】数据输出
line_new = f'{line_list[0]},{exp_new},{line_list[2]},{salary_avg},{line_list[4]},{hit_new},{line_list[7]}'
print(line_new)
# 计算经验平均薪资
def calc_exp_avg(exp):
exp_avg = 0
if '经验' in exp:
exp = exp.replace('年经验&#