✘three✘

这篇博客介绍了如何使用NumPy计算二维坐标点间的欧氏距离,以及通过Pandas对用户用电数据进行处理和分析,包括异常值处理、统计量计算、特征构造等操作。涉及数据读取、数据透视、四分位数异常值识别、差分计算、统计量聚合等技术。
摘要由CSDN通过智能技术生成

**一**

NumPy是用于数据科学计算的库。请使用NumPy库,编写Python代码求解各坐标点之间的距离。启动Jupyter Notebook创建一个Notebook。(2分)随机生成100个二维坐标点,并储存至数组arr1。(4分)计算各样本点之间的欧氏距离,并储存至数组arr2。(4分)将数组arr2的形状转换为(100, 100)。(3分)将数组arr2存储为当前工作路径下的一个二进制格式的文件arr2.npy。(2分)

-----------------分割线------------------

#(1)启动JupyterNotebook创建一个Notebook。(2分)

#(2)随机生成100个二维坐标点,并储存至数组arr1。(4分)

importnumpy as npx= np.linspace(0, 10, 100)y= np.linspace(10, 20, 100)arr1= np.array((x, y)).T # 数组arr1形状为(100, 2)#(3)计算各样本点之间的欧氏距离,并储存至数组arr2。(4分)

arr2= []fori in range(len(arr1)):for j inrange(len(arr1)):a =np.sqrt((arr1[i, 0] - arr1[j, 0]) ** 2 + (arr1[i, 1] - arr1[j, 1]) ** 2)arr2.append(a)arr2= np.array(arr2)

#(4)将数组arr2的形状转换为(100, 100)。(3分)

arr2= arr2.reshape(100, 100)

# (5)将数组arr2存储为当前工作路径下的一个二进制格式的文件arr2.npy。(2分) np.save('arr2.npy',arr2)

**二**

用户用电量数据探索与分析。data数据集为用户用电量数据,其中包含3个字段。具体特征说明如下:请根据用户用电量数据,编写Python代码完成下列操作:读取数据文件data.csv,并储存为数据框data。(2分)将数据框data转换为行索引为用户编号、列索引为时间、值为用户用电量的数据透视表data_new。(2分)采用四分位法对透视表data_new中的异常数据进行识别并处理。(4分)构造特征1:统计每个用户用电数据的基本统计量(基本统计量包括最大值、最小值、均值、中位数

  • 2
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值