- 博客(3)
- 资源 (1)
- 收藏
- 关注
原创 100天搞定机器学习(100-Days-Of-ML)(十七)Pandas处理缺失值
第十七天Pandas处理缺失值大多数教程里使用的数据与现实工作中的数据的区别在于后者很少是干净整齐的,许多流行的数据集都会有数据缺失的现象。如何处理这些缺失值对模型的训练有着重要的作用。下面学习一些处理缺失值的通用规则,Pandas对缺失值的表现形式,以及Pandas自带的几个处理缺失值的工具的用法。一、选择处理缺失值的方法在数据表或DataFrame中有很多识别缺失值的方法。一般情况下...
2019-03-17 17:55:20 333
原创 100天搞定机器学习(100-Days-Of-ML)(十六)Pandas数值运算方法
第十六天Pandas数值运算方法Numpy的基本功能之一是快速对每个元素进行运算,即包括基本算术,也包括更复杂的运算。Pandas继承了Numpy的功能。但是Pandas也实现了一些高效技巧:对于一元运算(像函数与三角函数),这些通用函数将在输出结果中保留索引和列标签;而对于二元运算(如加法和乘法),Pandas 在传递通用函数时会自动对齐索引进行计算。这就意味着,保存数据内容与组合不同来源...
2019-03-17 17:53:42 316
原创 100天搞定机器学习(100-Days-Of-ML)(十五)Pandas数据取值与选择
第十五天Pandas数据取值与选择在前面介绍了获取、设置、调整Numpy数组数值的方法,包括取值操作、切片操作、掩码操作、花哨的索引以及组合操作。下面介绍Pandas的Series 和DataFrame 对象相似的数据获取与调整操作。一、Series数据选择如前所述,Series 对象与一维NumPy 数组和标准Python 字典在许多方面都一样。只要牢记住这两个类比,就可以帮助我们更好地...
2019-03-17 17:52:06 225
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人