- 博客(3)
- 收藏
- 关注
原创 分子性质预测挑战赛(baseline)
本次学习体验了从报名到模型训练、预测、提交的完整流程学习了特征工程和模型训练的基础理解了决策树模型在机器学习中的应用。
2024-07-04 16:16:30
989
原创 动手数据分析
例如,如果数据中的缺失值被表示为空字符串而不是`np.nan`,使用`.isnull()`可能无法正确检测到这些缺失值。类别的包括个数,类别的数目,最高数量的类别及出现次数等;我们拿到的数据通常是不干净的,所谓的不干净,就是数据中有缺失值,有一些异常点等,需要经过一定的处理才能继续做后面的分析或建模,所以拿到数据的第一步是进行数据清洗,本章我们将学习。不同的数据存储和环境中对于缺失值的表示结果也不同,例如,数据库中是Null,Python返回对象是None,Pandas或Numpy中是NaN。
2024-03-13 21:31:41
892
原创 动手学数据分析
ndarray 是NumPy库中的主要数据结构,它是一个多。它的核心数据类型,提供了高效的数值运算和广泛的数学函数。以下是 numpy.ndarray 的一些重要特点和功能:1、多维数组:numpy.ndarray 可以是一维、二维或多维的数组,这使得它非常适合处理各种复杂的数据。2、数据类型:numpy.ndarray 可以包含不同数据类型的元素,如整数、浮点数、布尔值等。每个数组都有一个固定的数据类型,可通过 dtype 属性获得。
2024-03-12 22:17:22
1107
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人