pandas简介

pandas-01

参考:

说明

  • 基础模块导入
import pandas as pd
import numpy as np
  • 短名称(别名)
    • dfDataFrame对象
    • pdpandas导入后的别名
    • npnumpy导入后的别名

API使用

一. 构造DataFrame
  1. 分别指定行和列
    • data 为二维数组(一维为行列表,二维为每一行中的列列表)
    • columns 的长度 >= data的最长元素的长度
      doc: pandas.DataFrame
    data = [
        ['第一', 'hang' , '数据'], # 第一行
        ['第2', '行'] # 第二行
    ]
    columns = ['列1', '第二2', '列三'] # 列名列表
    df = pd.DataFrame(data, columns=columns)
    
  2. 传递一个字典(键为列名,值为列对应的数据串)

    字典所有值(数据串)的长度必须相同

    data = {
        'col1': [123, 45, 66],
        'col2': [66, None, 12]
    }
    df = pd.DataFrame(data)
    
  3. 从csv文件加载(pd.read_csv)

    可选参数:

    • encoding 编码, 默认为utf-8
    • index_col 索引列,默认为None(自动添加数字索引)
      doc: pandas.read_csv
    csv_path = r'C:\Users\zuxia\Desktop\01.csv'
    # 读取数据(指定encoding参数防止编码错误)
    df = pd.read_csv(csv_path, encoding='gbk')
    # 读取数据(指定第一列为索引列)
    df = pd.read_csv(csv_path, index_col=0)
    
    如果遇到编码错误,获取编码
    import chardet
    
    # 读取得到二进制数据
    raw_data = open(csv_path, 'rb').read()
    encoding = chardet.detect(raw_data).get('encoding', 'utf-8')
    

SQLAlchemy
PyMySQL

 

转载于:https://www.cnblogs.com/cp9648/p/10415659.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值