数据分析之python数据计算方法汇总(math|numpy|pandas)

本文详细介绍了使用Python进行数据分析时,如何运用pandas、math和numpy进行数据计算。从创建Series和DataFrame,到基础查询、索引切片、排序分组、数据合并,再到数值运算和数据清洗,最后涵盖文件的读写操作,覆盖了数据分析的常用步骤。
摘要由CSDN通过智能技术生成



数据分析之python数据计算方法上篇(math|numpy)_Backup and share的博客-CSDN博客

本文重点介绍pandas,math和numpy参见上篇>

目录

一、简介与创建

创建一个 Series

创建一个 Series,指定索引和列名

创建一个 DataFrame

创建一个 DataFrame,指定列名

二、基础查询操作

三、索引与切片

Series切片

DataFrame创建行索引并指定列名

DataFrame获取行数据

DataFrame获取列数据

DataFrame获取多行多列数据

DataFrame将指定列创建为索引/还原索引

四、排序、分组、合并

按索引排序

按值排序

groupby分组

merge合并

concat合并

append合并

join合并

五、数值运算、数据清洗

基础统计

累计统计

数据清洗

六、文件读写

1-将表格型文件数据读取为DataFrame对象

2-将DataFrame对象写入文件


一、简介与创建

Pandas 是 python 的一个 数据分析包 ,属于PyData项目的一部分。 主要数据结构是 Series (一维数据)与 DataFrame(二维数据)
Series是一种类似于一维数组的对象 包含一列数据及与其关联的一列数据标签,数据标签即为数据的序列。
DataFrame 是一个表格化的数据结构 ,它同时拥有行序号与列序号。
Series 构造方法:pandas.Series( data, index, name, dtype, copy)
DataFrame 构造方法:pandas.DataFrame( data, index, columns, dtype, copy)

创建一个 Series

import pandas as pd
s1 = pd.Series([1,3,5,7,6,8])
s1

创建一个 Series,指定索引和列名

import pandas as pd
s2 = pd.Series([1,3,5,7,6,8], index=['a', 'b', 'c' ,'d', 'e', 'f'], name='col')
s2

创建一个 DataFrame

import pandas as pd
df1 = pd.DataFrame([[1, 2], [3, 4]])
df1

创建一个 DataFrame,指定列名

data=[[1,2,3,4,5],[6,7,8,9,0]]
df2 = pd.DataFrame(data, columns=['col1','col2','col3','col4','col5']) 
df2

二、基础查询操作

df1.shape #获取行列数 (2, 2)
df1.info() #查看数据信息【列名,记录数,数据类型】
df1.describe()
  • 3
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值