主方法:
if__name__='__main__':
构造方法:
def __init__(self):
self.xxx=yyy
区分公有和私有
公有的正常写 name=’jack’
私有的前面加两个下划线 __age=12
方法:
对象方法具有self参数
def method(self):
类方法使用修饰器@classmethod,具有cls参数 def classMethod(cls)
静态方法使用@staticmethod不用参数
继承 class xxx(Father_class):
删除dataframe中的列:
.drop(“列名”,axis=1) 0横1纵
数据index重排数据,洗牌操作,返回列表:
shuffled_index=np.random.permutation(admissions.index)
xx=data.loc[shuffled_index,:]
.reset_index()#重置索引
loc通过行标签索引行数据
df.loc[1] df.loc['a']
iloc通过行号获取行数据
df.iloc[1]
df.iloc[0:]
#索引列
df.iloc[:,[1]]
ix 结合前两种
pandas中 get_dummies(_,prefix="A")
用于取出某一列,将列中的值映射成多维度
如
\ cylinders
0 3
1 3
2 4
3 5
4 6
5 4
6 8
7 4
转换为:
\ A_3 A_4 A_5 A_6 A_8
0 1 0 0 0 0
1 1 0 0 0 0
2 0 1 0 0 0
3 0 0 1 0 0
..
data[“xxx”].unique()
得到某一列xxx的元素去重后的list
data[“xxx”].value_counts()
某列计数
data.sort_values(“xxx”,inplace=True,ascending=False)
技巧,pandas中替换:
\ name age if_test
0 A
1 B
2 A
3 B
..
将A改为1,将B改为0:
status_replace={
"if_test":{
"A":1,
"B":0
}
}
data.replace(status_replace)
去掉字段中值中的特定内容
如:
size
XL65.6
XL65.72
XL32.63
XL47.54
想去掉size中的XL并将size变成数值float
data["size"].str.rstrip("XL").astype("float")