2021-04-30

Python训练营 Task4  Python数据分析:从0完成一个数据分析实战  学习笔记

学习地址:https://tianchi.aliyun.com/notebook-ai/detail?spm=5176.12281976.0.0.299c1c27cr9xQ1&postId=6068

 

一、学习知识点概要

【Python入门系列】了解Pandas 第三方库 并进行数据分析

二、学习内容

领学习者利用Python进行数据分析以及数据可视化,包含数据集的处理、数据探索与清洗、数据分析、数据可视化四部分,利用pandas等第三方库玩转数据分析

在pandas中有两类非常重要的数据结构,即序列Series和数据框DataFrame

 

1 Series的创建

1.1通过一维数组创建序列

import numpy as np, pandas as pd

arr1 = np.arange(10)
print(arr1)

#0123456789

 

1.2通过字典的方式创建序列

dic1 = {'a':10,'b':20,'c':30,'d':40,'e':50}
print(dic1)
print(type(dic1))

 

{'a': 10, 'b': 20, 'c': 30, 'd': 40, 'e': 50}
<class 'dict'>

2.利用pandas查询数据

 

import pandas as pd

stu_dic = {'Age':[14,13,13,14,14,12,12,15,13,12,11,14,12,15,16,12,15,11,15],
'Height':[69,56.5,65.3,62.8,63.5,57.3,59.8,62.5,62.5,59,51.3,64.3,56.3,66.5,72,64.8,67,57.5,66.5],
'Name':['Alfred','Alice','Barbara','Carol','Henry','James','Jane','Janet','Jeffrey','John','Joyce','Judy','Louise','Marry','Philip','Robert','Ronald','Thomas','Willam'],
'Sex':['M','F','F','F','M','M','F','F','M','M','F','F','F','F','M','M','M','M','M'],
'Weight':[112.5,84,98,102.5,102.5,83,84.5,112.5,84,99.5,50.5,90,77,112,150,128,133,85,112]}
student = pd.DataFrame(stu_dic)

3.利用pandas实现SQL操作

增:添加新行或增加新列

删:删除表、观测行或变量列

改:修改原始记录的值

查:有关数据查询部分

聚合:pandas模块中可以通过groupby()函数实现数据的聚合操作

三、学习问题与解答

pandas应该怎样应用于数据的可视化中,是否能够与Excel结合,提高工作效率

四、学习思考与总结

  这次任务主要学习了pandas 的基础知识,学习内容上与与以往学习python基础知识较为相似,例如pandas的增删与python的append函数很相似,学习起来相对以往来说没那么困难。

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值