Python数据分析入门(1)——数据分析基础步骤知识

本文详细介绍了Python数据分析的基础步骤,包括提出问题、数据收集(观测、问卷、数据库、网络爬虫)、数据处理与清洗,以及数据分析(描述性分析、探索分析:对比、同比、环比、细分)。强调了数据细分在分析中的重要性,同时提及了预测分析的常用方法。
摘要由CSDN通过智能技术生成

数据分析的步骤

第一步:提出问题
第二步:收集数据
第三步:数据处理和清洗
第四步:数据分析
第五步:可视化,得出结论

一、提出问题

一个数据分析的过程,其实是从数据中得到结论的过程。但分析的起点并非数据,而是问题! 先确定问题是什么,再投入精力从相关的数据中挖掘答案。

二、收集数据

通常情况下,我们想要收集数据,会有4种数据的来源:

1.观测和统计得到的数据

2.问卷和调研得到的数据

3.从数据库中获取的数据

4.从网络爬虫获取的数据

需要根据我们希望获得数据,来判断应该从哪些来源获取。

1)观测和统计数据

是指经过实地获取的实测数据。这类数据可大可小。

例如:一个商场的客流量。

这是对商场各个出入口的人员进出,按人头统计,汇总的数据,也是实地观测获得的。只是目前会有红外感应装置来获取,不需要人工来数了。

2)问卷和调研数据

是指通过抽取样本,用问卷或访谈的方式,获取的数据。 有一些需要获取到个人信息、心理感受的数据,我们需要通过询问访谈获得。

3)从数据库中获取的数据

数据库,可以简单理解为储存数据的一种结构。 我们在计算机、手机上产生的操作行为,被捕捉下来会存储到数据库中。例如:在电商平台上购买商品记录,会存储在

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值