python筛选数据并运算_Python数据分析—numpy数组运算练习

这篇博客通过一系列练习展示了如何使用numpy进行数据操作,包括读取csv和excel文件,数组的创建、转换和运算,如转置、广播、加减乘除,以及选择和过滤数组元素。此外,还介绍了如何利用numpy优化Matplotlib的条形图绘制,以及进行多条件数据筛选。
摘要由CSDN通过智能技术生成

numpy数组运算作业

作业1

dfa63825be2aec987b29565a2fbb1df9.png

导入相关的库

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei'] # 中文

plt.rcParams['axes.unicode_minus'] = False # 负号

练习1

方法一

canyin=pd.read_csv(r'D:\餐饮.csv',encoding='gbk')

方法二

import csv

with open('D:\餐饮.csv','r') as f:

datareader = csv.reader(f)

for row in datareader:

print(row)

练习2

stock=pd.read_excel(r'D:\Stock.xlsx')

练习3

1、输出0-9的数组arr

arr=np.arange(10)

arr

# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

2、查看arr的数据类型

arr.dtype

# dtype('int32')

3、创建0-5的数组,并指定其数据类型为“bool”

arr1=np.array(range(6),dtype='bool')

arr1.dtype

# dtype('bool')

4、改变数据类型为“float64”

arr1.astype('float64')

# array([0., 1., 1., 1., 1., 1.])

作业2

d36d937eadbf14d2a025c4e3bc6f6e3d.png

1、创建 2*2 的数组arr1 元素自定义

arr1=np.arange(4).reshape(2,2)

arr1

# array([[0, 1],

# [2, 3]])

2、创建 223 的数组arr2 元素自定义

arr2=np.arange(12).reshape(2,2,3)

arr2

# array([[[ 0, 1, 2],

# [ 3, 4, 5]],

# [[ 6, 7, 8],

# [ 9, 10, 11]]])

3、查看arr2的维度以及形状

print(arr2.ndim)

print(arr2.shape)

# 3

# (2, 2, 3)

4、将arr2转为1维

方法一:arr.flatten()

方法二:arr.ravel()

arr2.flatten()

arr2.ravel()

# array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11])

5、将arr1进行转置

方法一:arr.transpose()

方法二:arr.T

方法三:arr.swapaxes() 换轴

arr1.transpose()

arr1.T

arr1.swapaxes(1,0)

# array([[0, 2],

# [1, 3]])

6、生成 4*4 全为1的数组 arr3

arr3=np.ones((4,4))

arr3

# array([[1., 1., 1., 1.],

# [1., 1., 1., 1.],

# [1., 1., 1., 1.],

# [1., 1., 1., 1.]])

7、生成单位矩阵

np.eye(3)

# array([[1., 0., 0.],

# [0., 1., 0.],

# [0., 0., 1.]])

作业3

练习1

在讲解 Matplotlib 的时候,我们使用以下代码绘制分组条形图。其中讲解到,三根柱子的位置需要同时往左或往右移动时,需要使用到列表推导式。实际上,duck不必,请使用numpy的所学来优化我们该部分代码。

5e4b15a973548d88c2ef857c58a7e612.png

bf8674c6eed3d6c1e4641da366e7b808.png

numpy优化

# 创建一个画布

plt.figure(figsize=(6,4),dpi=100)

fruits = ["苹果","梨子","车厘子"]

Q1 = [1000,800,3000]

Q2 = [1200,700,2800]

width=0.35

# 用numpy优化代替列表推导式

po_l = np.arange(3)-width/2

po_r = np.arange(3)+width/2

plt.bar(po_l,Q1,width,label="Q1")

plt.bar(po_r,Q2,width,label="Q2")

# 定义一个函数获取每根柱子对应的数值

def demo(x_la,y_la):

for x,y in list(zip(x_la,y_la)):

plt.text(x,y+30,y,ha='center',va='bottom')

demo(po_l,Q1)

demo(po_r,Q2)

plt.legend(loc='upper left')

plt.ylim(0,3500)

plt.xticks(np.arange(3),fruits)

plt.show()

结果图

f348a852980f8c0f8530305d915bc520.png

练习2

2c65b16da749dbdd4faa6a6ff84a96d3.png

1、np.arange(16).reshape(4,4)与2做减法

arr=np.arange(16).reshape(4,4)

arr

# array([[ 0, 1, 2, 3],

# [ 4, 5, 6, 7],

# [ 8, 9, 10, 11],

# [12, 13, 14, 15]])

arr + 2

# array([[ 2, 3, 4, 5],

# [ 6, 7, 8, 9],

# [10, 11, 12, 13],

# [14, 15, 16, 17]])

2、np.arange(16).reshape(4,4)与np.arange(16,32).reshape(4,4)做加法运算

arr2=np.arange(16,32).reshape(4,4)

arr2

# array([[16, 17, 18, 19],

# [20, 21, 22, 23],

# [24, 25, 26, 27],

# [28, 29, 30, 31]])

arr + arr2

# array([[16, 18, 20, 22],

# [24, 26, 28, 30],

# [32, 34, 36, 38],

# [40, 42, 44, 46]])

3、np.arange(8).reshape(2,4)与np.arange(4)运算

arr3=np.arange(8).reshape(2,4)

arr3

# array([[0, 1, 2, 3],

# [4, 5, 6, 7]])

arr4=np.arange(4)

arr4

# array([0, 1, 2, 3])

arr3 + arr4

# array([[ 0, 2, 4, 6],

# [ 4, 6, 8, 10]])

4、np.arange(8).reshape(2,4)与np.arange(4).reshape(1,4)运算

0轴广播:与列数相同并且只有一行的数组进行运算

arr5=np.arange(4).reshape(1,4)

arr5

# array([0, 1, 2, 3])

arr3 + arr5

# array([[ 0, 2, 4, 6],

# [ 4, 6, 8, 10]])

5、np.arange(8).reshape(2,4)与np.arange(4).reshape(4,1)运算

注意:维度完全不一致的无法广播

arr6=np.arange(4).reshape(4,1)

arr3 + arr6

# ValueError: operands could not be broadcast together with shapes (2,4) (4,1)

练习3

1、构建数组

arr=np.arange(16).reshape(4,4)

arr

# array([[ 0, 1, 2, 3],

# [ 4, 5, 6, 7],

# [ 8, 9, 10, 11],

# [12, 13, 14, 15]])

2、选择第3列

arr[:,2:3]

# array([[ 2],

# [ 6],

# [10],

# [14]])

3、选择1-3列

arr[:,:3]

# array([[ 0, 1, 2],

# [ 4, 5, 6],

# [ 8, 9, 10],

# [12, 13, 14]])

4、选择2,4列

神奇索引:可以获得指定的元素位置构成子集

arr[:,[1,3]]

# array([[ 1, 3],

# [ 5, 7],

# [ 9, 11],

# [13, 15]])

5、选择 4,7 两个点 将值改为 0

arr[[1,1],[0,3]] # 4的位置是(1,0) 7的位置是(1,3)

# array([4, 7])

arr[[1,1],[0,3]]=0

arr

# array([[ 0, 1, 2, 3],

# [ 0, 5, 6, 0],

# [ 8, 9, 10, 11],

# [12, 13, 14, 15]])

6、过滤出<5的值

arr<5

# array([[ True, True, True, True],

# [ True, False, False, True],

# [False, False, False, False],

# [False, False, False, False]])

arr[arr<5]

# array([0, 1, 2, 3, 0, 0])

练习4:多条件筛选

numpy读取本地数据

score_data = np.loadtxt("D:\scores.csv",delimiter=",",skiprows=1)

筛选出 成绩 大于60 并且 小于80 的数据

score_data[(score_data>60) & (score_data<80)]

# array([73., 62., 73., 67., 65., 79., 69., 72., 73., 77., 71., 74., 77.,67.])

筛选出 成绩 大于80 并且 小于90 的数据

score_data[(score_data>80) & (score_data<90)]

# array([83., 82., 89., 88., 87., 81.])

筛选出 成绩 大于90 的数据

score_data[score_data>90]

# array([93., 98., 99., 96., 93., 96., 95.])

注:numpy多条件筛选

交集:用 & 或 * 连接,两边的条件有优先级最好加括号

并集:用 + 或 | 连接,两边的条件有优先级最好加括号

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值