一.数据类型
二.变量与赋值
三.数据结构
# 列表
menu_list=['蒸虾头','蒸鳄心','蒸乌鱼'];
menu_list
# 字典
menu_dict ={
'油饼':'2$',
'蒸馍':'2$',
'荔枝':'8&',
'深井饼':'7&',
}
menu_dict['油饼']
# 方括号代表一个excel表格,'油饼1':['2$','3$','4$']根据同一个表头按列进行填充
{
'油饼1':['2$','3$','4$'],
'油饼2':['2$','3$','4$'],
'油饼3':['2$','3$','4$']
}
#{'油饼1':'2', '油饼2':'2','油饼3':'2'} 根据不同表头按行进行填充
[
{'油饼1':'2', '油饼2':'2','油饼3':'2'},,
{'油饼1':'3', '油饼2':'3','油饼3':'3'},
{'油饼1':'4', '油饼2':'4','油饼3':'4'},
]
四.检索和访问
# 列表
#menu_list=['蒸虾头','蒸鳄心','蒸乌鱼'];
menu_list[0:3]
# # 字典
# menu_dict ={
# '油饼':'2$',
# '蒸馍':'2$',
# '荔枝':'8&',
# '深井饼':'7&',
# }
menu_dict['油饼']
五.实战训练
# 五.实战训练
ad_list=[{'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-25_2-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 2386, '直播间曝光数': 4117, '直播间观看数': 1646, '商品点击数': 757, '商品下单数': 73, '商品成交数': 8, 'GMV': 70400, 'roi': 0.3, '投放日期': '2023-01-02', '成交金额': 70400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_商业分析_18-25_2-6', '广告计划ID': 'AD667', '优化目标': '直播间成交', '客单价': 88, '消耗': 2238, '直播间曝光数': 3774, '直播间观看数': 2830, '商品点击数': 1867, '商品下单数': 97, '商品成交数': 13, 'GMV': 114400, 'roi': 0.51, '投放日期': '2023-01-02', '成交金额': 114400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_数据分析_18-25_2-6', '广告计划ID': 'AD668', '优化目标': '直播间成交', '客单价': 88, '消耗': 2097, '直播间曝光数': 3470, '直播间观看数': 2567, '商品点击数': 1925, '商品下单数': 100, '商品成交数': 13, 'GMV': 114400, 'roi': 0.55, '投放日期': '2023-01-02', '成交金额': 114400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《数据分析工具课程》_数据分析_22-35_2-6', '广告计划ID': 'AD999', '优化目标': '直播间成交', '客单价': 188, '消耗': 2246, '直播间曝光数': 2770, '直播间观看数': 1495, '商品点击数': 822, '商品下单数': 69, '商品成交数': 7, 'GMV': 131600, 'roi': 0.59, '投放日期': '2023-01-02', '成交金额': 131600}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《商业分析课程》_数据分析-商业分析_22-35_2-6', '广告计划ID': 'AD888', '优化目标': '直播间成交', '客单价': 288, '消耗': 3275, '直播间曝光数': 5406, '直播间观看数': 3784, '商品点击数': 2005, '商品下单数': 139, '商品成交数': 15, 'GMV': 432000, 'roi': 1.32, '投放日期': '2023-01-02', '成交金额': 432000}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-25_2-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 3671, '直播间曝光数': 5258, '直播间观看数': 2839, '商品点击数': 1391, '商品下单数': 138, '商品成交数': 11, 'GMV': 96800, 'roi': 0.26, '投放日期': '2023-01-03', '成交金额': 96800}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_商业分析_18-25_2-6', '广告计划ID': 'AD667', '优化目标': '直播间成交', '客单价': 88, '消耗': 2073, '直播间曝光数': 3559, '直播间观看数': 1423, '商品点击数': 1024, '商品下单数': 65, '商品成交数': 6, 'GMV': 52800, 'roi': 0.25, '投放日期': '2023-01-03', '成交金额': 52800}]
# 1.取数,并赋值给一个变量
ad_1=ad_list[0]
ad_1
# 2.处理重复的字段
del ad_1['成交金额']
# 3.处理异常值
ad_1['GMV']=ad_1['GMV']/100
ad_1
# 4.ROI
ad_1['ROI']=round(ad_1['GMV']/ad_1['消耗'],2)
ad_1
# 5.分割字符串
ad_1['广告计划名称'].split('_')
ad_1['商品名称']=ad_1['广告计划名称'].split('_')[0]
ad_1['用户标签']=ad_1['广告计划名称'].split('_')[1]
ad_1['用户年龄']=ad_1['广告计划名称'].split('_')[2]
ad_1['用户等级']=ad_1['广告计划名称'].split('_')[3]
ad_1
# 6.for循环
menu_list=['蒸虾头','蒸鳄心','蒸乌鱼'];
for item in menu_list:
print(item);
for i in range(len(ad_list)):
# 1.取数,并赋值给一个变量
ad_1=ad_list[i]
# 2.处理重复的字段
del ad_1['成交金额']
# 3.处理异常值
ad_1['GMV']=ad_1['GMV']/100
# 4.ROI
ad_1['ROI']=round(ad_1['GMV']/ad_1['消耗'],2)
# 5.分割字符串
ad_1['广告计划名称'].split('_')
ad_1['商品名称']=ad_1['广告计划名称'].split('_')[0]
ad_1['用户标签']=ad_1['广告计划名称'].split('_')[1]
ad_1['用户年龄']=ad_1['广告计划名称'].split('_')[2]
ad_1['用户等级']=ad_1['广告计划名称'].split('_')[3]
# 7.if语句
for i in range(len(ad_list)):
if ad_list[i]['ROI']>=1:
ad_list_fb.append(ad_list[i])
六.自定义函数
单个处理
def process_data(ad_list,i):
# 1.取数,并赋值给一个变量
ad_1=ad_list[i]
# 2.处理重复的字段
del ad_1['成交金额']
# 3.处理异常值
ad_1['GMV']=ad_1['GMV']/100
# 4.ROI
ad_1['ROI']=round(ad_1['GMV']/ad_1['消耗'],2)
# 5.分割字符串
ad_1['广告计划名称'].split('_')
ad_1['商品名称']=ad_1['广告计划名称'].split('_')[0]
ad_1['用户标签']=ad_1['广告计划名称'].split('_')[1]
ad_1['用户年龄']=ad_1['广告计划名称'].split('_')[2]
ad_1['用户等级']=ad_1['广告计划名称'].split('_')[3]
return ad_list[i]
批量处理
def batch_data(ad_list):
for i in range(len(ad_list)):
process_data(ad_list,i)
return ad_list