数据基础知识学习1

1. df.drop()

删除含有指定元素的行或列,或删除特定行

  1. 用法 ,DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)
  2. 参数说明
    label 要删除的行列名字,用列表给定
    axis 默认为0,指删除行,因此删除 columns 时要指定 axis=1
    index 直接指定要删除的行
    columns 直接指定要删除的列
    inplace=False 默认该删除操作不改变原始数据,而是返回一个执行删除操作后的新的dataframe。
    inplace=True,则会直接在原数据上进行删除操作,删除后无法返回。
    因此,删除行列有两种方式:
  3. labels = None, axis = 0的组合
  4. index或columns直接指定要删除的行或者列

2. join()方法

import pandas as pd

data1 = {
	"name":["Sally", "Mary", "John"],
	"age":[50, 40, 30]
}

data2 = {
	"qualified":[True, False, False]
}

df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)

newdf = df1.join(df2)

3. Pandas.reset_index()和.set_index()使用

当进行数据清洗或进行排序的时候,原数据的索引不是从零开始的索引,这样就需要使用 reset_index()记住那个重置索引。

  • 使用reset_index()将索引重新分配给序列号
    • 基本用法
    • 删除原始索引:参数drop
    • 更改原始对象:参数inplace
  • 使用 reset_index()和set_index()将索引更改为另一列(重置)
    如果使用 reset_index() 方法,则将序列号设置为索引,并将原始索引添加到data列
    如果将 set_index() 照原样应用于原始 DataFrame,则会删除原始索引
    **如果要将原始索引保留为数据字符串,则可以在 reset_index()之后使用 set_index() **

4. strftime与strptime

需要将时间格式转化为字符串格式,或者需要把字符串格式转化为时间格式。
此处有两个方法:strftimestrptime

  1. 将 DatetimeIndex 中的值获取出来
    DatetimeIndex 中的标量的值其实是 Timestamp 对象(时间戳对象)
  2. 将 Timestamp对象通过 strftime转化为字符串格式
#方法1
str(data.index[1])

#方法2 通过strftime
data.index[1].strftime('%Y-%m-%d')

data.index[1].strftime('%Y-%m-%d %H-%M-%S')
  1. 将字符串对象通过 strptime转化为时间格式
from datetime import datetime
str_time = '2020-01-02'
datetime.strptime(str_time,'%Y-%m-%d')

总结: 使用strptime可以将字符串对象转化为时间格式(datetime格式),并且strptime需要传递两个参数,而使用strftime可以将时间格式对象转化为字符串格式,其只用传递一个参数。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值