数据分析是一个广义的概念,在很多工作中都需要用到数据分析,甚至有些公司专门设置了数据分析师的岗位。
数据分析师是大城市中比较热门的岗位,主要通过各类数据分析工具对数据中的信息进行分析挖掘,撰写数据分析报告来为公司提供决策建议。
想要学懂Python数据分析,很重要的一点需要有一定的python基础,特别是要对类和对象的相关概念有所了解,因为python数据分析涉及到的库(pandas、numpy、matplotlib、pyecharts)中都应用到了类和对象。
想要进一步的完成一些有难度的数据分析任务,需要我们将python的函数、循环和判断等语句融会贯通,与数据分析相关知识结合起来解决数据分析问题。
因此,有必要确认自己的python基础掌握情况,进行针对性复习
在excel中,我们可以通过选中一列数据来对其进行数据类型修改、查看列平均值、计数、求和等统计信息、排序等等操作
excel中也可以通过选中所有表格数据来构建一个【数据透视表】,进而统计表格中各个维度的统计数据。
在python中,我们不能像excel一样用鼠标对结构化数据进行自由的选择。python是通过类和对象的思想将结构化数据中的【列】和【表格】封装成了【对象】,再通过该【对象】的【属性】和【方法】来对其进行操作,实现各类数据分析需求。
“python的数据处理工具”是一个宽泛的词,这里我们特指【DataFrame类】和【Series类】这两个python中专门用来处理【结构化数据】的类。
【DataFrame类】和【Series类】来自数据分析核心库【pandas】,以下是关于pandas库的一些介绍:
统计分析就是狭义的数据分析,指通过计算不同维度的统计量指标来挖掘数据中的信息。
考虑这样一个统计分析需求:
在“电影评分.csv”表中记录着各国家豆瓣评分的高分电影数据,试计算各个国家高分电影的总数量,找到排名前10的国家。如果影片由多个国家拍摄,则以第一个国家作为拍摄国家进行统计。
Python通过pandas库的DataFrame表格对象一样可以完成上述任务,虽然单就这个任务而言,没有excel实现起来这么简单,但在处理一些更复杂的数据分析任务时,Python更有优势。
类的定义和创建对象
有参构造方法
在创建对象时输入属性的值
猜拳游戏模块及其调用
1、在.py文件中定义一个函数,函数调用后可以和电脑进行猜拳游戏。
2、通过input函数来用键盘输入1、2、3以此来表示“石头、剪刀、布”,与电脑随机出的结果进行游戏。
3、程序要能够判断输赢情况。
4、在另一个jupyter文件中调用上述.py文件的游戏函数进行游戏。
导入外部数据
导入excel与csv
导入数据库的数据
1.创建MySQL引擎对象
2.将表格上传到MySQL数据库
3.读取数据库中的表格
Dataframe表格对象
1.表格对象的获取方法
2.表格对象的常用属性
3.表格对象的基本方法
3.1 head(n)方法访问前n数据
3.2 info方法查看表格的基本信息
3.3 describe方法计算数值型列的统计量
3.4 rename方法实现列名称重命名
3.5 to_excel方法能将表格对象输出成excel
表格对象增删查改
1.三种基本的数据查询方法
2.表格对象的条件查询
3.reset_index方法实现索引重置
4.表格对象数据的新增
5.drop方法删除数据
6.数据的修改