python数据处理库numpy、pandas数组操作

1.numpy

1.1数组行列

import numpy as np
data_np=np.array(data)
data_col=data_np[:,2:]
data_row=data_np[]

1.2数组拼接

  • 按列拼接
data_cat_col=np.concatenate((data_left, data_right), axis=1
  • 按行拼接1
data_cat_row=np.concatenate((data_top, data_button), axis=0
  • 按行拼接2
data_cat_row=np.row_stack((data_top, data_button))

2.pandas

2.1数组行列

import pandas as pd
data=pd.DataFrame(data)
//#列:取数组中最后一列之前的数据到新数组中
data_col=data[data.columns[:-1]]
//#行:取数组中的前3行到新数组中
data_row=data.iloc[:3,]

2.2数据拼接

  • 按列拼接

  • 按行拼接1

data_out=data_out.append(data_in)

3.数据按行随机化

from sklearn.utils import shuffle
data_row_random=shuffle(data_in)
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
NumPyPandasPython中两个用于数据分析的重要NumPy是一个数学,提供了多维数组对象和用于处理这些数组的函数。它是大多数数据科学工具和的基础。Pandas是一个数据处理和分析,它建立在NumPy之上,提供了用于处理操作结构化数据的高级数据结构和函数。 NumPy的主要特点是它的多维数组对象(也称为ndarray),它可以存储相同类型的元素。这使得NumPy非常适合进行数学和统计计算,以及处理大规模数据集。NumPy还提供了许多用于数组操作的函数,包括索引、切片、聚合操作、线性代数、傅里叶变换等。在数据分析中,NumPy常用于数据清洗、转换和计算。 Pandas是基于NumPy构建的,它提供了两个主要的数据结构:Series和DataFrame。Series是一维标记数组,类似于带有标签的NumPy数组。DataFrame是一个二维表格,类似于Excel或SQL表。Pandas提供了丰富的功能,包括数据的读取和写入、数据清洗、数据过滤、数据聚合、数据可视化等。 Pandas的优势在于它的表格结构和灵活的数据处理能力。它可以处理不同类型的数据(整数、浮点数、字符串等),并且可以进行缺失值处理和重复值处理。此外,Pandas还提供了强大的数据操作功能,如合并、拼接、分组和透视等。 综上所述,NumPyPandas是两个在数据分析中广泛使用的Python,它们提供了高效的数据处理和分析工具,能够满足不同场景下的需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值