pandas模块学习笔记

最新推荐文章于 2021-12-24 11:46:03 发布

早学晚学早晚要学

最新推荐文章于 2021-12-24 11:46:03 发布

阅读量138

点赞数

分类专栏：写作业遇到的问题文章标签： python

本文链接：https://blog.csdn.net/zaozaoxue/article/details/106854268

版权

写作业遇到的问题专栏收录该内容

2 篇文章 0 订阅

订阅专栏

import pandas as pd

读取csv/pkl文件

df = pd.read_csv ('/path',usecols=['',''])
#读取pkl文件：data_df = pd.read_pickle ('/path',usecols=['',''])

更改列名

#列名的数量需要和读取csv后的列数量一致且对应
df.columns = ['','']

显示列名清单

#只显示列名清单，在处理列较多的数据比较有用
print(list(df))

按列名从旧数据框创建新数据框

data_new = pd.DataFrame(df,columns = ['',''])

将DataFrame存储为csv,index表示是否显示行名，默认为True

df.to_csv("test.csv",index=False,sep=',')

去掉某些列（并不会改变原来的数据框）

df.drop(columns=['列名', '列名'])

删除数据框中的缺失值NaN：

df.dropna(axis=0, how='any', thresh=None, subset=None, inplace=False)

主要的2个参数：
#axis=0: 删除包含缺失值（NaN）的行
#axis=1: 删除包含缺失值（NaN）的列
#how=‘any’ :要有缺失值（NaN）出现删除
#how=‘all’: 所有的值都缺失（NaN）才删除

这两个要配合使用才好。

还有一个thresh参数
如果缺失值（NaN）的数量大于thresh，将删除。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

早学晚学早晚要学

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

python to_csv和read_csv索引加入内容的问题

lwgkzl的博客

07-06

1万+

先看如下代码：path = "../test/test_sort.csv" df = pd.DataFrame([['a','a','a'],['a','a','a'],['a','a','a'],['a','a','a'],['a','a','a']]) df.to_csv(path) print df aa = pd.read_csv(path) print aa产生结果如下：可以看到，下一...

pandas read_csv参数index_col = None,0,False的区别

weixin_40992494的博客

02-27

1万+

前言网上好多对index_col的解释都有点别扭，基本都是将False和None等同起来了。（都是重新设置一列成为index值），所以我去谷歌了解了一下。介绍 pandas是python中的一个库，read_csv是pandas的读取csv数据的一个函数。而index_col是read_csv中的一个参数。用来指定表格的索引值。来看下pandas官方文档是怎么定义index_col的： in...

参与评论您还未登录，请先登录后发表或查看评论

pd.read_csv()||pd.to_csv()索引问题index

漫步量化

03-08

1万+

# to_csv()存储时不加索引 df.to_csv(path, index= False, header= False) # read_csv()读取时声明第一列是索引,第一行是索引 df = pd.read_csv(path, index_col= 0, header= 0) header = 0 # 源文件第一行作为读取后的列索引 header = None # 源文件没有列索引，自...

pd.read_csv方法读csv文件时使用index_col参数设置第一列作为index

weixin_41855010的博客

02-13

1万+

我现在采用read_csv()文件，修改后保存to_csv()文件的方式来对数据库进行修改，问题来了，在read_csv()的时候，系统会默认第一列是第一个字段而不是index，这样在保存的时候就会凭空多处一列index，这对于修改操作来说，显然是不可持续的，因为我们每次都希望看到边界稳定的表格。那么怎么办呢？read_csv()方法提供了index_col参数来设定DataFrame的index...

Pandas模块（学习笔记）

wxwzy1314的博客

12-10

2294

Pandas的数据结构 Pandas包含以下三种数据结构：系列(Series)，数据帧(DataFrame)，面板(Panel)。这些数据结构构建在Numpy数组之上，这意味着它们处理速度很快。 Series：同种类型数据构成大小不可变数据可变 Series：一维数组，与Numpy中的一维array类似，二者与Python基本的数据结构List也很相近。 Series能保存不同种数据类型，字符串、boolean值、数字等。 Series是由相同数据类型组成的一维数组。 DataFrame：

pandas学习笔记

雨落

12-24

1071

一、pandas库的Series类型 1、初始化 1、一维Series可以用一维列表初始化 a=pd.Series([1,3,5,np.nan,6,5]) 2、索引 1、默认的情况下，Series的下标都是数字（可以使用额外参数指定），类型是统一的 b=pd.Series([1,3,5,np.nan,6,5],index=['a','b','c','d','e','f']) print(b) 2、索引——数据行标签 a.index 3、取值 a.values 4、切片 a[2:5] 5、索引赋值

算法学习笔记—-Day31（pandas中时间序列、数据可视化）

12-22

目录第一部分：pandas时间序列一.python中的时间日期二.pandas中的时间...datetime模块和timedelta模块 1.datetime(2016, 3, 20, 8, 30).strftime('%Y-%m-%d %H:%M:%S')—-strftime从time格式转化成字符串str格式，st

Python --numpy,pandas,matplotlib等学习笔记.zip

最新发布

02-21

这个压缩包文件"Python --numpy,pandas,matplotlib等学习笔记.zip"包含了一系列关于Python中三个核心库的学习资料：NumPy、Pandas和Matplotlib。这三个库是Python科学计算的基础，对于任何想要深入Python数据分析的...

pandas模块的使用(二)

学习笔记

10-04

411

数据合并之join: join:默认情况下他是把行索引相同的数据合并到一起 In [6]: t1 = pd.DataFrame(np.zeros((2,5)),index=["A","B"],columns=list("VWXYZ")) In [7]: t1 Out[7]: V W X Y Z A 0.0 0.0 0.0 0.0 0.0 B 0.0 0.0 0.0 0.0 0.0 In [8]: t2 = pd.DataFrame(np.ones

Pandas模块 -- 实操练习

weixin_30681615的博客

07-27

1350

如果对序列进行数学函数的运算，首选numpy模块；如果对序列做统计运算，首选序列的“方法”，因为序列的“方法”更加丰富，如计算序列的偏度、峰度等，而Numpy模块是没有这样的函数。手工构造数据框DataFrame时，一般首选字典方法。因为通过字典的方法构造数据框，则字典的键构成数据框的变量名。 arr1=pd.DataFrame([['张三',23,'男'],['李四',...

Python数据处理——Pandas模块使用（五）

Mr番茄蛋的博客

06-01

311

本文主要介绍pandas数据转换操作 1.分组 In [42]: df = DataFrame({'key1':['a','a','b','b','a'],'key2':['one','two','one','two','one'],'data1':np.random.randn(5) ...: ,'data2':np.random.randn(5)}) In [43]: d...

pandas读取csv数据时设置index

weixin_33726318的博客

05-05

5479

比如读取数据时想把第一列设为index，那么只需要简单的 pd.read_csv("new_wordvecter.csv",index_col=[0]) 这里index_col可以设为列名后续更改index可以使用df.index = df.iloc[:,"column"].tolist()或df.set_index('column') ...

pandas.read_csv()读取csv文件，默认第一列为index（索引）的解决办法

热门推荐

richand112233的博客

06-30

4万+

示例： df = pd.read_csv(fpath) 直接读取会使文件中第一列数据默认为df的index，使列名和列数据发生错位。可以添加以下参数： index_col: int or sequence or False, default None 修改为如下代码即可使index设为默认从0开始： df = pd.read_csv(fpath,index_col=False ) ...

Python：pandas模块的简介及常用方法

第一周的Python之路

11-28

606

导入pandas库 import pandas as pd 2.pandas数据结构简介 pandas的核心为两大数据结构，数据分析相关的所有事务都是围绕着这两种结构进行的： Series Series这类数据结构用于存储一个序列的一维数据， DataFrame 用于存储多维数据（类似于excel表格的结构）。 2.1 Series pandas库的Series对象用来表示一维数据结...

python办公自动化（9）利用pandas的行列转换处理排班表

在路上的博客

05-30

2010

python办公自动化（9）利用pandas的行列转换处理排班表公司有个部门上班时间和其他部门不同，每月需要制作排班表导入OA系统，数据是这样的：如果要导入到OA系统数据必须要转换成这样： 1.pandas行转列 #!/usr/bin/python # -*- coding: gbk -*- import pandas as pd df=pd.read_csv('2.csv',encoding="gbk",index_col=['姓名']) #删除空列 df.dropna(axis=1,how=

【python实战】---- 30行代码提取个人值班表

止于至善

06-02

497

需求是这样的

Python数据处理——Pandas模块使用（二）

Mr番茄蛋的博客

05-07

3251

数据变换操作导入文件 import numpy as np import pandas as pd odata = pd.read_csv('example.csv') 这三行代码就可以实现csv文件的导入，注意文件的路径删除行 Data1 = data.drop([16,17]) drop()方法如果不设置参数inplace=True，则只能在生成的新数据块中实现删除效果，而...

python与数据挖掘上机实验pandas_Python与数据挖掘学习笔记（1）——Pandas模块

06-09

这篇笔记主要介绍了Pandas模块的基本操作和使用方法。Pandas是Python中一个用于数据分析和处理的常用库，提供了高效的数据结构和数据分析工具，是进行数据处理和数据挖掘的重要工具之一。一、Pandas数据结构 ...