AI学习：python.pandas的csv数据读写学习（第七天）

最新推荐文章于 2024-04-24 11:56:06 发布

定个小目标：1亿行代码

最新推荐文章于 2024-04-24 11:56:06 发布

阅读量224

点赞数

文章标签： pandas python 人工智能

本文链接：https://blog.csdn.net/weixin_52241563/article/details/125501916

版权

import pandas as pd
import numpy as np
from pandas import DataFrame,Series

data_train = pd.read_csv("D:/dataset/titanic.csv")
data_train.info()

执行结果：

pd.read_csv(filepath,encoding,sep,header,names,usecols,index_col,skiprows,nrows……）

filepath： 文件存储路径，可以用r""进行非转义限定，路径最好是纯英文（文件名也是），不然会经常碰到编码不对的问题，最方便是直接将文件存储在pandas默认的路径下，则直接输入文件名即可
encoding: pandas默认编码是utf-8，如果是csv，且数据中有中文时，则要指定encoding=‘gbk’
sep: 指定分割符形式，CSV默认逗号分割，可以忽略这个参数，如果是其它分割方式，则要填写
header: 指定第一行是否是列名，通常有三种用法，忽略或header=0(表示数据第一行为列名），header=None（表明数据没有列名），常与names搭配使用
names: 指定列名，通常用一个字符串列表表示，当header=0时，用names可以替换掉第数据中的第一行作为列名，如果header=None，用names可以增加一行作为列名，如果没有header参数时，用names会增加一行作为列名，原数据的第一行仍然保留
usecols: 一个字符串列表，可以指定读取的列名
index_col: 一个字符串列表，指定哪几列作为索引
skiprows: 跳过多少行再读取数据，通常是数据不太干净，需要去除掉表头才会用到
nrows: 仅读取多少行，后面的处理也都仅限于读取的这些行