数据分析之python数据计算方法汇总(math|numpy|pandas)

原创

于 2022-05-13 17:19:22 发布 · 3.8k 阅读

·

3

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

#数据分析 #python #数据挖掘

本文详细介绍了使用Python进行数据分析时，如何运用pandas、math和numpy进行数据计算。从创建Series和DataFrame，到基础查询、索引切片、排序分组、数据合并，再到数值运算和数据清洗，最后涵盖文件的读写操作，覆盖了数据分析的常用步骤。

数据分析之python数据计算方法上篇(math|numpy)_Backup and share的博客-CSDN博客

本文重点介绍pandas，math和numpy参见上篇>

目录

一、简介与创建

创建一个 Series

创建一个 Series，指定索引和列名

创建一个 DataFrame

创建一个 DataFrame，指定列名

二、基础查询操作

三、索引与切片

DataFrame创建行索引并指定列名

DataFrame获取行数据

DataFrame获取列数据

DataFrame获取多行多列数据

DataFrame将指定列创建为索引/还原索引

四、排序、分组、合并

按索引排序

五、数值运算、数据清洗

六、文件读写

1-将表格型文件数据读取为DataFrame对象

2-将DataFrame对象写入文件

一、简介与创建

Pandas 是 python 的一个 数据分析包 ，属于PyData项目的一部分。主要数据结构是 Series （一维数据）与 DataFrame（二维数据）

Series是一种类似于一维数组的对象，包含一列数据及与其关联的一列数据标签，数据标签即为数据的序列。

DataFrame 是一个表格化的数据结构，它同时拥有行序号与列序号。

Series 构造方法：pandas.Series( data, index, name, dtype, copy)

DataFrame 构造方法：pandas.DataFrame( data, index, columns, dtype, copy)

创建一个 Series

import pandas as pd

s1 = pd.Series([1,3,5,7,6,8])

s1

创建一个 Series，指定索引和列名

import pandas as pd

s2 = pd.Series([1,3,5,7,6,8], index=['a', 'b', 'c' ,'d', 'e', 'f'], name='col')

s2

创建一个 DataFrame

import pandas as pd

df1 = pd.DataFrame([[1, 2], [3, 4]])

df1

创建一个 DataFrame，指定列名

data=[[1,2,3,4,5],[6,7,8,9,0]]

df2 = pd.DataFrame(data, columns=['col1','col2','col3','col4','col5'])

df2

二、基础查询操作

df1.shape #获取行列数 (2, 2)

df1.info() #查看数据信息【列名，记录数，数据类型】

df1.describe() #查看数值数据的情况【计数，平均，标准差，最大，最小，分位数】

df1.head() #返回前5行

df1.head(n) #返回前n行

df1.tail() #返回后5行

df1.colname.value_counts() #查看数据中colname列对应值计数分布

<

最低0.47元/天解锁文章

评论 2

成就一亿技术人!

拼手气红包6.0元

还能输入1000个字符

添加红包

插入表情

表情包

代码片

HTML/XML
objective-c
Ruby
PHP
C
C++
JavaScript
Python
Java
CSS
SQL
其它

查看更多评论

条评论被折叠查看

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。