筛选元素,判断是否存在等:
df.isin([ ]) 判断df中是否有括号中的元素
DataFrame([data, index, columns, dtype, copy]) 构造数据框
data[data.isin[ ]] 可以将符合isin()的元素提取出来构造成一个新的data
DataFrame( ) 创建一个datafram对象eg:
df.insert('列数', 'ones', 'data') 在数据中插入一列元素,三个参数:要插入第几列(0开始),该列标签,插入内容
df.data.columns 存储了一个该data中所有的列的标签名称
df.iloc[a:b,c :d] 切片操作,前一个表示行数,后一个表示列数,左闭右开,从0开始
(若参数是 “ :-n” 一个负数,则表示去掉最后n行/列;若参数是 “ -n”: 一个负数,则表示只要最后n行/列)
提取数据元素时:
data.iloc[:,:].values 提取出来的是一维数组
data['labelname'].values 提取出来的是array类型的多维数组
创建字典时要用后者这种单纯的一维数组来创建,前者创建出来的每个字典键值的值是一个矩阵类型的