- 博客(2)
- 收藏
- 关注
原创 笔记:阿里云天池作业
4.另外power数据规定取值在[0,600],但是数据中存在大于600的样本共143个,占比不大,因此对样本>600的power可以取600代替。8.RandomForestRegressor().fit(X_train,y_train)#随机森林回归模型。6.fillna(要填充的值)函数可以在数据框或者序列中找到缺失值,并用指定的值或方法进行填充。5.pd.concat:以指定轴,也就是说既可以横向拼接,又可以纵向拼接。1.将训练数据及测试数据导入,使用sep=' '分隔,并观察数据。
2024-07-27 21:09:24 110
原创 笔记:Pandas入门
pd.read_csv("train.csv", names=['乘客ID','是否幸存','仓位等级','姓名','性别','年龄','兄弟姐妹个数','父母子女个数','船票信息','票价','客舱','登船港口'],index_col='乘客ID', header=0)(train_data['兄弟姐妹个数'] + train_data['父母子女个数']).max()max(train_data['兄弟姐妹个数'] + train_data['父母子女个数'])
2024-07-22 19:07:22 388
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人