1. df.drop()
删除含有指定元素的行或列,或删除特定行
- 用法 ,DataFrame.drop(labels=None,axis=0, index=None, columns=None, inplace=False)
- 参数说明
label 要删除的行列名字,用列表给定
axis 默认为0,指删除行,因此删除 columns 时要指定 axis=1
index 直接指定要删除的行
columns 直接指定要删除的列
inplace=False 默认该删除操作不改变原始数据,而是返回一个执行删除操作后的新的dataframe。
inplace=True,则会直接在原数据上进行删除操作,删除后无法返回。
因此,删除行列有两种方式: - labels = None, axis = 0的组合
- index或columns直接指定要删除的行或者列
2. join()方法
import pandas as pd
data1 = {
"name":["Sally", "Mary", "John"],
"age":[50, 40, 30]
}
data2 = {
"qualified":[True, False, False]
}
df1 = pd.DataFrame(data1)
df2 = pd.DataFrame(data2)
newdf = df1.join(df2)
3. Pandas.reset_index()和.set_index()使用
当进行数据清洗或进行排序的时候,原数据的索引不是从零开始的索引,这样就需要使用 reset_index()记住那个重置索引。
- 使用reset_index()将索引重新分配给序列号
- 基本用法
- 删除原始索引:参数drop
- 更改原始对象:参数inplace
- 使用 reset_index()和set_index()将索引更改为另一列(重置)
如果使用 reset_index() 方法,则将序列号设置为索引,并将原始索引添加到data列
如果将 set_index() 照原样应用于原始 DataFrame,则会删除原始索引
**如果要将原始索引保留为数据字符串,则可以在 reset_index()之后使用 set_index() **
4. strftime与strptime
需要将时间格式转化为字符串格式,或者需要把字符串格式转化为时间格式。
此处有两个方法:strftime和strptime
- 将 DatetimeIndex 中的值获取出来
DatetimeIndex 中的标量的值其实是 Timestamp 对象(时间戳对象) - 将 Timestamp对象通过 strftime转化为字符串格式
#方法1
str(data.index[1])
#方法2 通过strftime
data.index[1].strftime('%Y-%m-%d')
data.index[1].strftime('%Y-%m-%d %H-%M-%S')
- 将字符串对象通过 strptime转化为时间格式
from datetime import datetime
str_time = '2020-01-02'
datetime.strptime(str_time,'%Y-%m-%d')
总结: 使用strptime可以将字符串对象转化为时间格式(datetime格式),并且strptime需要传递两个参数,而使用strftime可以将时间格式对象转化为字符串格式,其只用传递一个参数。