【Python模块学习】pandas模块简介

pandas模块学习

一、背景概述

Pandas (Python Data Analysis Library) 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。

numpy更加适用于科学计算领域;而pandas最初据说是设计用于金融领域,因此pandas可能更加适用于各类实际应用场景的处理。另一方面,numpy适用于处理“干净”的数据,及规范、无缺失的数据,而pandas更加擅长数据清洗(data munging),这为后一步数据处理扫清障碍。

Excel 可以处理少量的数据,但是当我们用爬虫收集到很多的数据的时候,此时就需要pandas模块进行处理

Pandas中的三种Python数据结构

  • Series:一堆数组。与Python标准的数据结构List列表很像
  • DataFrame:二维的表格型数据结构。可以理解为Serise容器
  • Panel:三维数组,可以理解为DataFrame容器

Pandas支持的数据类型

  • data1=pandas.read_html(‘1.html’)
  • data2=pandas.read_json(‘2.json’)
  • data3=pandas.read_csv(‘3.csv’)

二、Series

一维数据结构,键值对

用法:

pandas.Series(data,index,dtype,copy)

  • data 数据采取各种形式
  • index 索引值必须是唯一的和散列的,与数据长度相同。默认np.arange(n),如果没有索引被传递
  • dtype 用户数据类型。如果没有,将推断数据类型
  • copy 复制数据,默认为false
import pandas

if  __name__ == '__main__':
    data=['apple','male','chiken0']
    data1=pandas.Series(data)
    data2=pandas.DataFrame()
    #data3=pandas.Panel()
    print(data1)

在这里插入图片描述

import pandas

if  __name__ == '__main__':
    data=pandas.Series()
    print(type(data))
    #print(data)

在这里插入图片描述

import pandas

if  __name__ == '__main__':
    data={'name':'小王','age':'18'}
    print(pandas.Series(data))
    print(pandas.Series(data)['name'])

在这里插入图片描述

三、DataFrame

二维数据结构,数据以行和列的表格的形式排列,可以结合xlwt模块处理excel表格 (想办法怎么把字典转换为列表格式)

用法:

pandas.DataFrame(data,index,columns,dtype,copy)

  • data 数据采取各种形式
  • index 对于行标签,要用于结果帧的索引是可选缺醒值 np.arange(n),如果没有索引被传递
  • columns 对于列标签,可选的默认语法是 np.arange(n) 这只是在没有索引传递情况下才是这样
  • dtype 每列的数据类型
  • copy 复制数据,默认为false

写入 .xls 文件

写入 xls文件的两种方式

方法1:
write_xls(sheetname,data1,path) # data1 是列表

方法2:
df.pandas.DataFrame(data1) # data 是列表
df.to_excel(‘test.xls’)

import pandas
import xlwt

def write_xls(sheet_name,value,path):
    index=len(value)
    xls=xlwt.Workbook()                         #创建xls文件
    table0 = xls.add_sheet(sheet_name)          #创建一个表格
    for i in range(0,index):                    #写入数据
        for j in range(0,len(value[i])):
            table0.write(i,j,value[i][j])
    xls.save(path)

if __name__ == '__main__':
    data1=[['id','001'],['name','dog'],['age',5]]
    #sheetname='test_sheet'
    #path='test.xls'
    df=pandas.DataFrame(data1)
    df.to_excel('test.xls')
    #write_xls(sheetname,data1,path)

DataFrame 数据的读取

从字典创建一个序列必须有 index=

import pandas

if __name__ == '__main__':
    data={'id':'001','name':'dog','age':'3',
    'id2':'002','name2':'cat','age2':'2'}       #创建一个字典                                  
    df=pandas.DataFrame(data,index=[111])       #将上面data数据,标记为 111行
    print(df['name'])
    print('-'*20)
    print(df.iloc[0])       #打印第一行的数据
    print('-'*20)
    print(df.loc[111])      #打印出 行名是111 的那行数据

在这里插入图片描述

参考

https://everyang.net/wp-content/uploads/2018/04/Pandas01-everyang.pdf

  • 1
    点赞
  • 20
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: 在安装 Pandas 模块之前,您需要确保已经安装了 Python。接下来,您可以按照以下步骤安装 Pandas 模块: 1. 打开命令行终端(Windows 上可以使用命令提示符或 PowerShell,Mac 或 Linux 上可以使用终端)。 2. 在命令行中输入以下命令安装 Pandas: ``` pip install pandas ``` 如果您使用的是 Python 3,可能需要使用以下命令: ``` pip3 install pandas ``` 3. 等待安装完成。安装完成后,您就可以在 Python 中使用 Pandas 模块了。 希望对您有所帮助! ### 回答2: Pandas是一个为数据分析和处理而创建的优秀Python库。在Python环境中使用Pandas,你需要先安装Pandas模块。以下是安装Pandas的步骤: 1.检查Python版本:在安装Pandas之前,必须确认已经安装最新版本的Python。可以在你的终端输入"python -V"命令来检查Python版本。 2.使用pip安装Pandas:pip是Python的软件包管理器,可以用来安装各种Python库。要安装Pandas,打开终端,键入"pip install pandas"并按下回车。 3.确认安装Pandas:安装完成后,可以在Python文件中导入Pandas,并在Python中使用它的功能。在Python文件中,输入"import pandas as pd"来引入Pandas模块,并输入"print(pd.__version__)"查看已安装的Pandas版本。 以上就是安装Pandas模块的步骤。需要注意的是,在安装Pandas之前,必须首先安装最新版本的Python。安装过程可能有些复杂,但是学会了在Python中使用Pandas之后,你将能够轻松地完成各种数据分析和处理任务。 ### 回答3: PandasPython语言中十分流行的数据分析库,它提供了高效的数据结构和数据分析工具,因此在数据分析领域被广泛应用。在使用Pandas之前,首先需要将其安装到计算机中,下面将介绍Python如何安装Pandas模块的方法。 方法一:使用pip安装Pandas pip是Python的包管理工具,它可以方便地下载和安装Python第三方库。使用pip安装Pandas模块的步骤如下: 1.打开终端或命令提示符,并输入以下命令: pip install pandas 2.等待安装完成后,即可使用Pandas模块。 方法二:使用Anaconda安装Pandas Anaconda是Python的一个科学计算发行版,它集成了众多流行的科学计算工具,包括Pandas。使用Anaconda安装Pandas模块的步骤如下: 1.下载并安装Anaconda,安装过程中请勾选“Add Anaconda to my PATH environment variable”。 2.打开Anaconda Navigator,点击“Environments”进入环境管理页面。 3.选择“root”环境,点击“Open Terminal”打开终端。 4.在终端中输入以下命令安装Pandas: conda install pandas 5.等待安装完成后,即可使用Pandas模块。 综上所述,Python安装Pandas模块有两种方法,分别是使用pip和使用Anaconda。在实际使用中,可以根据自己的需求和环境选择合适的安装方式,以便更好地进行数据分析和处理。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Buffedon

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值