学习目标:
内容链接:
https://tianchi.aliyun.com/specials/promotion/aicamppython?spm=5176.19782939.J_5614344200.2.3ad4564b61mfN0
- 利用pandas分析进行一个从0到1的数据分析
- 这次任务的内容在之前学的时候就感觉学的不是很好,这次主要是复健+补充学习。
学习内容:
一、从0完成一个数据分析实战
【说明:完全没接触过pandas,不清楚为什么python学习里面会插入这个内容,要求还是一天,应该是想让我们有个大概的了解把】
- 先是进行数据处理,利用pandas将需要的有关联的数据放在一个表里面(用到的函数有pd.merge()函数用于将表联合,还有用于读取的pd.read_csv()函数。
- 第二步就是进行数据的探索和清洗。在这里我们通过info函数显示出每一列的大概信息(但也就是有多少非空的值,每一列的类型),然后①检查是否有类型不符合,比如时间的类型应该是str在数据表里保存的是int。②通故inf函数显示出来哪一列数据是有空缺的,以便通过相关的函数将其替换掉。
最后还可以通过describe函数来看具体的信息(这个具体的信息就是非常的具体,比如说是像中值,平均值啥的会显示出来)
3.在对数据进行处理完后就要开始进行数据分析,然后数据分析这一各部分就是开始
①对我们需要达成的目的上去靠拢,比如这个比赛是用来预测美国总统啥的,我们可以统计各个不同方面的