pandas使用技巧【1】如何读入表单数据

简介: 本文主要介绍如何利用pandas读入表单数据。

读入数据

  • pandas.read_csv()
    从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为'',"
  • pandas.read_table()
    从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为"\t"
参数:
  1. 分隔符参数:sep=
    read_csv和read_table的区别在于separator分隔符。csv是逗号分隔值(Comma-Separated Values),仅能正确读入以 "," 分割的数据。
pd.read_table("ex1.csv",  sep=",")
  1. 是否读取文本数据的header:header=
    headers = None表示使用默认分配的列名,一般用在读取没有header的数据文件。
pd.read_table("ex1.csv",  header=None)
  1. 为文本的数据加上列名: names=
    names = user_cols ,自定义列名为user_cols。
pd.read_table("ex1.csv",  names = user_cols)
  1. 明确索引值: index_col=
    index_col = user_col,明确表示要将user_col放入索引位置。
pd.read_table("ex1.csv",  names = names,  index_col = user_col)

也可以将多个列都放入索引位置,做成层次化索引。

pd.read_table("ex1.csv",  names = names,  index_col = ["col1",  "col2"])
  1. 跳过指定行: skiprows=
    skiprows = row_list_to_skipped,可以用与跳过非有效数据如注释等情形下。
pd.read_table("ex1.csv",  skiprows = [row1,  row2,..., rown])
  1. 缺失值处理:na_values=
    na_values= ["null"],用null字符替换缺失值。
pd.read_table("ex1.csv",  na_values= ["null"])
  1. 尝试将数据解析为日期:parse_dates=
    parse_dates = True,尝试解析所有可能为日期类型的列。
pd.read_table("ex1.csv",  parse_dates = True)

parse_dates = [1, 2],尝试解析给定列为日期类型的列。

pd.read_table("ex1.csv",  parse_dates = [1, 2])
  1. 指定需要读取的行数:nrows=
    nrows = 100, 指定读取前100行数据。
pd.read_table("ex1.csv",  nrows = 100)

写出数据

  • pandas.read_csv()
    从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为'',"
  • pandas.read_table()
    从文件,URL,文件型对象中加载带分隔符的数据。默认分隔符为"\t"

参数和读入数据类似。


附上函数原型:

附上小哥哥的视频链接Data analysis in Python with pandas

所有文章列表

转载于:https://www.cnblogs.com/shewell/p/7813174.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值