自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 机器学习过程中的一些小问题

对于回归问题,一般使用其他指标来评估模型的性能,例如均方误差(Mean Squared Error,MSE)、均方根误差(Root Mean Squared Error,RMSE)、平均绝对误差(Mean Absolute Error,MAE)等。当面对数据较少但目标变量过多的回归问题时,由于数据的不足,模型可能难以准确地拟合这么多目标变量,这可能导致R方指标较低。在二分类问题中,F1指标可以用于综合评估模型的性能,尤其在样本不平衡的情况下。它的值介于0和1之间,数值越接近1表示模型的性能越好。

2023-09-16 11:37:06 71 1

原创 怎么修改DataFrame数据类型列名

然后,我们通过字典或函数定义了新的列名。最后,我们使用 rename() 方法或直接赋值给 columns 属性来修改列名。通过 inplace=True 参数或直接赋值来确保修改应用到原始 DataFrame 中。要修改 DataFrame 的列名,可以使用 rename() 方法来实现。rename() 方法允许你指定一个字典或函数来重新命名列名。注意:rename() 方法返回一个新的 DataFrame,而直接修改 df.columns 是在原始 DataFrame 上进行的修改。

2023-09-14 17:19:41 797 1

原创 数据分析中为什么要进行pd.get_dummies()操作?

请注意,进行独热编码并不是所有情况下都必要的。对于一些算法(如决策树),可以直接使用分类变量,而无需进行独热编码。但对于其他需要数值输入的算法,或者在分类变量中存在多个类别时,独热编码可以提供更好的特征表示。在数据分析中,pd.get_dummies() 是 pandas 库中的一个函数,用于进行独热编码(One-Hot Encoding)。独热编码是将分类变量转换为二进制向量的常用技术。

2023-09-14 14:58:35 593 1

原创 机器学习入门建议

本文将介绍机器学习的基本概念、学习方法,以及本人在学习过程中的感悟,以供初学者参考,希望能够帮以助大家更好地学习《机器学习》这门课程。

2023-09-07 09:24:19 124 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除