把value插入dataframe的指定位置loc中,若插入的数据value已在DataFrame中,则返回 错误ValueError,如想完成重复值的插入需要把allow_duplicates设置为True
insert方法详解
DataFrame.insert(loc, column, value, allow_duplicates=False)
参数:
Raises a ValueError if column is already contained in the DataFrame, unless allow_duplicates is set to True.
Parameters:
loc : 参数column插入的位置,如果想插入到第一例则为0,取值范围: 0 <= loc <= len(columns),其中len(columns)为Dataframe的列数
column :给 插入数据value取列名,可为数字,字符串等
value : 可以是整数,Series或者数组等
allow_duplicates : 默认 False
创建数据
import pandas as pd
import numpy as np
data = {
'school' : ['北京大学', '清华大学', '山西大学', '山西大学', '武汉大学'],
'name' : ['江路离', '沈希梦', '来使鹭', '陈曦冉', '姜浩然'],
'No.' : [20001943, 300044451, 20190006, 20191234, 1242522]
}
# data = list(data) <-> data = list(data.keys)
# data = list(data.values())
frame = pd.DataFrame(data)
print(frame)
结果:
2.插入数据
frame.insert(0, 'num', np.ones(5))
print(frame)
结果:
frame.insert(len(frame.columns), 'list', [x for x in range(5)])
print(frame)
3.插入已存在数据
结果:
4.把allow_duplicates设置为True,可实现重复值的插入
frame.insert(0, 'num', np.ones(5), allow_duplicates=True)
print(frame)