Python数据分析学习笔记

数据分析是一个广义的概念,在很多工作中都需要用到数据分析,甚至有些公司专门设置了数据分析师的岗位。

数据分析师是大城市中比较热门的岗位,主要通过各类数据分析工具对数据中的信息进行分析挖掘,撰写数据分析报告来为公司提供决策建议。

想要学懂Python数据分析,很重要的一点需要有一定的python基础,特别是要对类和对象的相关概念有所了解,因为python数据分析涉及到的库(pandas、numpy、matplotlib、pyecharts)中都应用到了类和对象。

想要进一步的完成一些有难度的数据分析任务,需要我们将python的函数、循环和判断等语句融会贯通,与数据分析相关知识结合起来解决数据分析问题。

因此,有必要确认自己的python基础掌握情况,进行针对性复习

在excel中,我们可以通过选中一列数据来对其进行数据类型修改、查看列平均值、计数、求和等统计信息、排序等等操作

excel中也可以通过选中所有表格数据来构建一个【数据透视表】,进而统计表格中各个维度的统计数据。

          

在python中,我们不能像excel一样用鼠标对结构化数据进行自由的选择。python是通过类和对象的思想将结构化数据中的【列】和【表格】封装成了【对象】,再通过该【对象】的【属性】和【方法】来对其进行操作,实现各类数据分析需求。

“python的数据处理工具”是一个宽泛的词,这里我们特指【DataFrame类】和【Series类】这两个python中专门用来处理【结构化数据】的类。

【DataFrame类】和【Series类】来自数据分析核心库【pandas】,以下是关于pandas库的一些介绍:

统计分析就是狭义的数据分析,指通过计算不同维度的统计量指标来挖掘数据中的信息。

考虑这样一个统计分析需求:

在“电影评分.csv”表中记录着各国家豆瓣评分的高分电影数据,试计算各个国家高分电影的总数量,找到排名前10的国家。如果影片由多个国家拍摄,则以第一个国家作为拍摄国家进行统计。

Python通过pandas库的DataFrame表格对象一样可以完成上述任务,虽然单就这个任务而言,没有excel实现起来这么简单,但在处理一些更复杂的数据分析任务时,Python更有优势。

类的定义和创建对象

有参构造方法

在创建对象时输入属性的值

猜拳游戏模块及其调用

1、在.py文件中定义一个函数,函数调用后可以和电脑进行猜拳游戏。

2、通过input函数来用键盘输入1、2、3以此来表示“石头、剪刀、布”,与电脑随机出的结果进行游戏。

3、程序要能够判断输赢情况。

4、在另一个jupyter文件中调用上述.py文件的游戏函数进行游戏。

导入外部数据

导入excel与csv

导入数据库的数据

1.创建MySQL引擎对象

2.将表格上传到MySQL数据库

3.读取数据库中的表格

Dataframe表格对象

1.表格对象的获取方法

2.表格对象的常用属性

3.表格对象的基本方法

    3.1 head(n)方法访问前n数据
    3.2 info方法查看表格的基本信息
    3.3 describe方法计算数值型列的统计量
    3.4 rename方法实现列名称重命名
    3.5 to_excel方法能将表格对象输出成excel

表格对象增删查改

1.三种基本的数据查询方法

2.表格对象的条件查询

3.reset_index方法实现索引重置

4.表格对象数据的新增

5.drop方法删除数据

6.数据的修改

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值