joyful pandas第1章 Pandas基础

本文是joyful pandas系列的第一章,主要介绍了Pandas的基础知识,包括文件的读取与写入(csv, txt, xls/xlsx格式)、Series和DataFrame的基本操作如创建、访问、修改、排序,以及常用的基本函数如head、tail、unique等。通过学习,你可以掌握Pandas的基本用法并进行数据处理。" 136789465,9369275,FPGA开发:常用综合软件解析,"['FPGA开发', '硬件描述语言', '综合工具']
摘要由CSDN通过智能技术生成

Learning Objective

Task01:Pandas基础(1天)

  • 理论部分
    掌握常见文件格式的读写操作
    理解并熟悉 Series 和 DataFrame 的重要属性和重要方法
    掌握各类排序(索引排序和值排序、单级排序和多级排序)
  • 练习部分
    《权利的游戏》剧本数据集分析
    科比投篮数据集分析

理论部分

import pandas as pd
import numpy as np

查看Pandas版本

pd.__version__

在这里插入图片描述

一、文件读取与写入

1. 读取
(a)csv格式
df = pd.read_csv('table.csv')
df.head() #head( )函数的原型中,默认的参数size大小是 5,所以会返回 5 个数据

在这里插入图片描述
原表格样式
在这里插入图片描述

(b)txt格式
df_txt = pd.read_table('table.txt') #可设置sep分隔符参数
df_txt

在这里插入图片描述
原表格样式:
在这里插入图片描述

(c)xls或xlsx格式
#需要安装xlrd包
df_excel = pd.read_excel('table.xlsx')
df_excel.head()

在这里插入图片描述
原表格样式:
在这里插入图片描述

2. 写入
(a)csv格式
df.to_csv('new_table.csv')
#df.to_csv('new_table.csv', index=False) #保存时除去行索引
(b)xls或xlsx格式
#需要安装openpyxl
df.to_excel('new_table2.xlsx', sheet_name='Sheet1')

二、基本数据结构

1.Series

Series相当于数组numpy.array类似, Series 可以理解为一维数组, 其一个索引index对应一个值values; 也可以看做是定长的有序字典.

(a)创建一个Series

对于一个Series,其中最常用的属性为值(values),索引(index),名字(name),类型(dtype)

s = pd.Series(np.random.randn(5),index=['a','b','c','d','e'],name='这是一个Series',dtype='float64')
s

在这里插入图片描述

(b) 访问Series属性
s.values
s.name
s.index
s.dtype

在这里插入图片描述

(c)取出某一个元素

将在第2章详细讨论索引的应用,这里先大致了解

s['a']

在这里插入图片描述

(d)调用方法
s.mean()

在这里插入图片描述

Series有相当多的方法可以调用:

#查看series的其他方法
print([attr for attr in dir(s) if not attr.startswith('_')])
2.DataFrame

DataFrame是一种表格型数据结构,它含有一组有序的列,每列可以是不同的值。DataFrame既有行索引,也有列索引,它可以看作是由Series组成的字典,不过这些Series公用一个索引。

DataFrame的创建有多种方式,不过最重要的还是根据dict进行创建,以及读取csv或者txt文件来创建。

作者:文哥的学习日记
链接:https://www.jianshu.com/p/8024ceef4fe2
来源:简书

(a)创建一个DataFrame
df = pd.DataFrame({
   'col1':list('abcde'),'col2':range(5,10),'col3':[1.3,2.5,3.6,4.6,5.8]},                 index=list('一二三四五'))df

在这里插入图片描述

(b)从DataFrame取出一列为Series
df['col1']

在这里插入图片描述


                
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值