Python数据分析基础知识(入门版)

1. 数据类型

对于给出的数据,例如:[{'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-25_2-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 2386, '直播间曝光数': 4117, '直播间观看数': 1646, '商品点击数': 757, '商品下单数': 73, '商品成交数': 8, 'GMV': 70400, 'roi': 0.3, '投放日期': '2023-01-02', '成交金额': 70400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_商业分析_18-25_2-6', '广告计划ID': 'AD667', '优化目标': '直播间成交', '客单价': 88, '消耗': 2238, '直播间曝光数': 3774, '直播间观看数': 2830, '商品点击数': 1867, '商品下单数': 97, '商品成交数': 13, 'GMV': 114400, 'roi': 0.51, '投放日期': '2023-01-02', '成交金额': 114400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_数据分析_18-25_2-6', '广告计划ID': 'AD668', '优化目标': '直播间成交', '客单价': 88, '消耗': 2097, '直播间曝光数': 3470, '直播间观看数': 2567, '商品点击数': 1925, '商品下单数': 100, '商品成交数': 13, 'GMV': 114400, 'roi': 0.55, '投放日期': '2023-01-02', '成交金额': 114400}]。

 '直播间成交'带有英文单引号,是文本字符串,88和2386属于数值类型,都是整数,0.51也是数值类型,属于浮点型数值。

2. 变量与赋值

变量的作用是存储数据,我们将数据存储到变量中,然后再进行一系列的操作处理,这个过程也叫做赋值。例如我们将上面的数据赋值给一个叫做ad_list的变量,代码如下

ad_list = [{'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-25_2-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 2386, '直播间曝光数': 4117, '直播间观看数': 1646, '商品点击数': 757, '商品下单数': 73, '商品成交数': 8, 'GMV': 70400, 'roi': 0.3, '投放日期': '2023-01-02', '成交金额': 70400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_商业分析_18-25_2-6', '广告计划ID': 'AD667', '优化目标': '直播间成交', '客单价': 88, '消耗': 2238, '直播间曝光数': 3774, '直播间观看数': 2830, '商品点击数': 1867, '商品下单数': 97, '商品成交数': 13, 'GMV': 114400, 'roi': 0.51, '投放日期': '2023-01-02', '成交金额': 114400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_数据分析_18-25_2-6', '广告计划ID': 'AD668', '优化目标': '直播间成交', '客单价': 88, '消耗': 2097, '直播间曝光数': 3470, '直播间观看数': 2567, '商品点击数': 1925, '商品下单数': 100, '商品成交数': 13, 'GMV': 114400, 'roi': 0.55, '投放日期': '2023-01-02', '成交金额': 114400}]

以后对这份数据进行处理时,只需要输入变量名,就可将该变量存储的数据调用出来。例如在jupyter notebook中输入ad_list,按住shift+回车键,即可运行该变量。

3. 数据结构

[{'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_职场新人_18-25_2-6', '广告计划ID': 'AD666', '优化目标': '直播间成交', '客单价': 88, '消耗': 2386, '直播间曝光数': 4117, '直播间观看数': 1646, '商品点击数': 757, '商品下单数': 73, '商品成交数': 8, 'GMV': 70400, 'roi': 0.3, '投放日期': '2023-01-02', '成交金额': 70400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_商业分析_18-25_2-6', '广告计划ID': 'AD667', '优化目标': '直播间成交', '客单价': 88, '消耗': 2238, '直播间曝光数': 3774, '直播间观看数': 2830, '商品点击数': 1867, '商品下单数': 97, '商品成交数': 13, 'GMV': 114400, 'roi': 0.51, '投放日期': '2023-01-02', '成交金额': 114400}, {'投放账户': '戴戴戴师兄', '广告计划名称': '《戴你玩转数据分析》_数据分析_18-25_2-6', '广告计划ID': 'AD668', '优化目标': '直播间成交', '客单价': 88, '消耗': 2097, '直播间曝光数': 3470, '直播间观看数': 2567, '商品点击数': 1925, '商品下单数': 100, '商品成交数': 13, 'GMV': 114400, 'roi': 0.55, '投放日期': '2023-01-02', '成交金额': 114400}],这份数据的最外侧右方括号包围,表明这份数据的数据结构是列表。

当数据量级非常大时,用变量存储每一份数据是不太合理的,因此可以使用列表将多个数据保存到同一变量中,让代码变得更加简洁。

同时,上面的数据中还有花括号{},这种数据结构叫做字典,组成结构为{键:值},由键和值组成,当数据的结构为{键1:值1,键2:值2,键3:值3,键4:值4},该数据属于字典。当列表中有很多数据时,取出想要的数据成为难题,而字典可以解决这样的困扰。

例如图中的数据,列表中没有字典,如果想查看地理的成绩,就需要在列表中数地理在第几位,地理在第6位,数据查询的方式为先输入变量名,输入“[]”,在方括号中输入地理在列表中的排序,输入“5”(计算机第一位从0开始),代码为class_list[5]

而如果采用字典的方式,输入查询代码class_grade['地理']即可查到地理成绩,不必知道地理在数据中的位置。

4. Python中的数据结构和Excel数据结构的关系

4.1 纯列表结构[xx,xx,xx,xx]

在Python中,如果数据以简单的列表形式进行储存,例如class_list = ['语文 88','数学 85','英语 89','政治 95','历史 87','地理 92','物理 83','化学 91','生物 94'],它在Excel中可以看作是一行或一列数据,存储形式如下图所示。在Excel中,第一行通常用于存放表头,我们的目前的数据是没有表头的。

4.2  纯字典结构{k:v,k:v,k:v,k:v,k:v}

如果我们的数据是字典形式,例如class_grade = {'语文':'88','数学':'85','英语':'89','政治':'95','历史':'87','地理':'92','物理':'83','化学':'91','生物':'94'},它在Excel中可以看作是一行,存储形式如下图所示。字典中的键相当于表头,值相当于该列的数据。

4.3 字典中含列表结构{k:v,k:v,k:v,k:v,k:v},其中v是列表

如果我们的数据是字典结构,其中v是列表,例如class_grade = {'语文':['88','85','89','95','87','92','83','91','94']},它在Excel中可以看作是一列带有表头的数据,存储形式如下图所示。字典中的键相当于表头,值对应的列表相当于该列的数据。

如果字典中有许多这样的结构,即{k:v,k:v,k:v,k:v,k:v}中v是列表,例如class_grade = {'语文':['88','85','89','95','87','92','83','91','94'],'数学':['98','86','87','91','86','73','93','85','92']},那么数据是由多列数据组成多行多列数据。

4.4 列表中含有字典结构[{k:v,k:v,k:v},{k:v,k:v,k:v},{k:v,k:v,k:v}]

如果我们的数据是列表,里面有字典,例如class_grade = [{'语文':'88','数学':'85','英语':'89'}],它在Excel中可以看作是一行带有表头的数据。

如果列表中有多个字典,例如[{'语文':'88','数学':'85','英语':'89'},{'语文':'84','数学':'91','英语':'81'}],那么数据是由多行数据组成多行多列数据。

5. 检索/访问

5.1 对列表的检索

如果想检索某一个数据,首先输入变量名,然后输入方括号,在方括号内输入数据对应的序号(计算机的第一个序号为0)。例如在class_list = ['语文 88'

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值