![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Python数据处理常用库
文章平均质量分 75
科学计算基础软件包NumPy;结构化数据分析工具Pandas;绘图库Matplotlib;科学计算工具包SciPy;机器学习工具包Scikit-learn
欧阳敏敏
高级测试开发工程师的学习之路。
展开
-
如何用Python的pandas库删除表的列中有缺失值的行数据
如果设置为 False(或省略),则会返回包含删除行的新 DataFrame,而原来的 students DataFrame 将保持不变。在 pandas 中,缺失的数据通常由 NaN(非数字的缩写)值表示,题目中显示为 None,也被 pandas 认为是缺失值。题目的意思是学生信息的 pandas DataFrame 中name 列中有一些行缺少值(None 或 NaN),有丢失的数据。subset: 要考虑的另一个轴上的标签,例如,如果您正在删除行,则这些标签将是要包括的列的列表。原创 2023-10-27 11:01:55 · 343 阅读 · 0 评论 -
如何用Python的pandas库根据指定列删除重复的行
subset:此参数标识重复行时要考虑的列标签或标签序列。如果未提供,它将处理 DataFrame 中的所有列。keep:此参数确定要保留的重复行。‘first’: (默认) 删除除第一个匹配项以外的重复项。‘last’: 删除除最后一个匹配项之外的重复项。False: 删除所有重复项。inplace: 如果设置为 True,则直接对对象进行更改,而不返回新的对象。如果设置为 False(默认),则返回丢弃重复的新对象。原创 2023-10-27 11:00:50 · 277 阅读 · 0 评论 -
如何用Python的pandas库创建新列,计算员工奖金为工资的两倍
那么题目的解题思路我们可以创建新列,列名为bonus ,值为salary列值的两倍,然后将新列分配给 employees DataFrame。当我们执行 employees[‘bonus’] = employees[‘salary’] * 2, 我们会在 DataFrame employees 中创建一个叫做 bonus 的新列,并且使用 salary 列值的双倍填充它。题目要求我们在 DataFrame employees 中创建一个新的列 ‘bonus’,新列是每个员工工资的两倍。原创 2023-10-26 07:56:12 · 160 阅读 · 0 评论 -
如何用Python的pandas库从表中创建 DataFrame
def createDataframe(student_data: List[List[int]]) -> pd.DataFrame: #该行定义了一个名为 createDataframe 的函数,该函数接受 DataFrame student_data 作为参数并返回 DataFrame。原创 2023-10-26 07:55:41 · 389 阅读 · 0 评论 -
如何用Python的pandas库函数将相同结构的两张表连接为一张表
题目的意思是有两个DataFrame,且有相同的列结构 student_id,name 和 age。想要垂直地连接两个 DataFrame,df1 和 df2。可以使用pandas 内部的一个方便的函数pd.concat()垂直(按行)或水平(按列)连接 DataFrame。对于该题目我们用pd.concat()函数垂直连接 DataFrame,需要确保列的顺序一致。编写一个解决方案,将两个 DataFrames。连接成一个 DataFrame。结果格式如下示例所示。原创 2023-10-25 13:05:23 · 124 阅读 · 0 评论 -
如何用Python的pandas库修改列的数据类型
相反,它返回具有指定数据类型更改的新 DataFrame。如果您希望反映原始 DataFrame 中的更改,则需要将结果重新赋值给它或相应地使用。的 DataFrame,它包含学生数据。但是,分数存储为浮点数,而不是整数。设置为 False,则只有在旧对象无法强制转换为所需类型的情况下才会创建新对象。: 控制对提供的数据类型的无效数据引发异常。: 它是一种数据类型,或列名->数据类型的字典。对象强制转换为指定的数据类型(数据类型)。列被存储为浮点数,将它转换为整数。因此,在我们的例子中,我们希望将。原创 2023-10-25 13:04:33 · 196 阅读 · 0 评论