Python数据分析—numpy数组运算练习

作业1

在这里插入图片描述
导入相关的库

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = ['SimHei']  # 中文
plt.rcParams['axes.unicode_minus'] = False    # 负号

练习1

方法一

canyin=pd.read_csv(r'D:\餐饮.csv',encoding='gbk')

方法二

import csv
with open('D:\餐饮.csv','r') as f:
    datareader = csv.reader(f)
    for row in datareader:
        print(row)

练习2

stock=pd.read_excel(r'D:\Stock.xlsx')

练习3

1、输出0-9的数组arr

arr=np.arange(10)
arr
# array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

2、查看arr的数据类型

arr.dtype
# dtype('int32')

3、创建0-5的数组,并指定其数据类型为“bool”

arr1=np.array(range(6),dtype='bool')
arr1.dtype
# dtype('bool')

4、改变数据类型为“float64”

arr1.astype('float64')
# array([0., 1., 1., 1., 1., 1.])

作业2

在这里插入图片描述

1、创建 2*2 的数组arr1 元素自定义

arr1=np.arange(4).reshape(2,2)
arr1
# array([[0, 1],
#       [2, 3]])

2、创建 223 的数组arr2 元素自定义

arr2=np.arange(12).reshape(2,2,3)
arr2
# array([[[ 0,  1,  2],
#        [ 3,  4,  5]],

#       [[ 6,  7,  8],
#        [ 9, 10, 11]]])

3、查看arr2的维度以及形状

print(arr2.ndim)
print(arr2.shape)
# 3
# (2, 2, 3)

4、将arr2转为1维

方法一:arr.flatten()
方法二:arr.ravel()

arr2.flatten()
arr2.ravel()
# array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11])

5、将arr1进行转置

方法一:arr.transpose()
方法二:arr.T
方法三:arr.swapaxes() 换轴

arr1.transpose()
arr1.T
arr1.swapaxes(1,0)
# array([[0, 2],
#       [1, 3]])

6、生成 4*4 全为1的数组 arr3

arr3=np.ones((4,4))
arr3
# array([[1., 1., 1., 1.],
#       [1., 1., 1., 1.],
#       [1., 1., 1., 1.],
#       [1., 1., 1., 1.]])

7、生成单位矩阵

np.eye(3)
# array([[1., 0., 0.],
#       [0., 1., 0.],
#       [0., 0., 1.]])

作业3

练习1

在讲解 Matplotlib 的时候,我们使用以下代码绘制分组条形图。其中讲解到,三根柱子的位置需要同时往左或往右移动时,需要使用到列表推导式。实际上,duck不必,请使用numpy的所学来优化我们该部分代码。
在这里插入图片描述
在这里插入图片描述
numpy优化

# 创建一个画布
plt.figure(figsize=(6,4),dpi=100)

fruits = ["苹果","梨子","车厘子"]
Q1 = [1000,800,3000]
Q2 = [1200,700,2800]
width=0.35
# 用numpy优化代替列表推导式 
po_l = np.arange(3)-width/2
po_r = np.arange(3)+width/2

plt.bar(po_l,Q1,width,label="Q1")
plt.bar(po_r,Q2,width,label="Q2")
# 定义一个函数获取每根柱子对应的数值
def demo(x_la,y_la):
    for x,y in list(zip(x_la,y_la)):
        plt.text(x,y+30,y,ha='center',va='bottom')
demo(po_l,Q1)
demo(po_r,Q2)

plt.legend(loc='upper left')
plt.ylim(0,3500)
plt.xticks(np.arange(3),fruits)
plt.show()

结果图
在这里插入图片描述

练习2

在这里插入图片描述
1、np.arange(16).reshape(4,4)与2做减法

arr=np.arange(16).reshape(4,4)
arr
# array([[ 0,  1,  2,  3],
#       [ 4,  5,  6,  7],
#       [ 8,  9, 10, 11],
#       [12, 13, 14, 15]])

arr + 2
# array([[ 2,  3,  4,  5],
#       [ 6,  7,  8,  9],
#       [10, 11, 12, 13],
#       [14, 15, 16, 17]])

2、np.arange(16).reshape(4,4)与np.arange(16,32).reshape(4,4)做加法运算

arr2=np.arange(16,32).reshape(4,4)
arr2
# array([[16, 17, 18, 19],
#       [20, 21, 22, 23],
#       [24, 25, 26, 27],
#       [28, 29, 30, 31]])

arr + arr2
# array([[16, 18, 20, 22],
#       [24, 26, 28, 30],
#       [32, 34, 36, 38],
#       [40, 42, 44, 46]])

3、np.arange(8).reshape(2,4)与np.arange(4)运算

arr3=np.arange(8).reshape(2,4)
arr3
# array([[0, 1, 2, 3],
#       [4, 5, 6, 7]])

arr4=np.arange(4)
arr4
# array([0, 1, 2, 3])

arr3 + arr4
# array([[ 0,  2,  4,  6],
#       [ 4,  6,  8, 10]])

4、np.arange(8).reshape(2,4)与np.arange(4).reshape(1,4)运算

0轴广播:与列数相同并且只有一行的数组进行运算

arr5=np.arange(4).reshape(1,4)
arr5
# array([0, 1, 2, 3])

arr3 + arr5
# array([[ 0,  2,  4,  6],
#       [ 4,  6,  8, 10]])

5、np.arange(8).reshape(2,4)与np.arange(4).reshape(4,1)运算

注意:维度完全不一致的无法广播

arr6=np.arange(4).reshape(4,1)
arr3 + arr6
# ValueError: operands could not be broadcast together with shapes (2,4) (4,1) 

练习3

1、构建数组

arr=np.arange(16).reshape(4,4)
arr
# array([[ 0,  1,  2,  3],
#       [ 4,  5,  6,  7],
#       [ 8,  9, 10, 11],
#       [12, 13, 14, 15]])

2、选择第3列

arr[:,2:3]
# array([[ 2],
#       [ 6],
#       [10],
#       [14]])

3、选择1-3列

arr[:,:3]
# array([[ 0,  1,  2],
#       [ 4,  5,  6],
#       [ 8,  9, 10],
#       [12, 13, 14]])

4、选择2,4列

神奇索引:可以获得指定的元素位置构成子集

arr[:,[1,3]]
# array([[ 1,  3],
#       [ 5,  7],
#       [ 9, 11],
#       [13, 15]])

5、选择 4,7 两个点 将值改为 0

arr[[1,1],[0,3]]   # 4的位置是(1,0)  7的位置是(1,3)
# array([4, 7])

arr[[1,1],[0,3]]=0
arr
# array([[ 0,  1,  2,  3],
#       [ 0,  5,  6,  0],
#       [ 8,  9, 10, 11],
#       [12, 13, 14, 15]])

6、过滤出<5的值

arr<5
# array([[ True,  True,  True,  True],
#       [ True, False, False,  True],
#       [False, False, False, False],
#       [False, False, False, False]])

arr[arr<5]
# array([0, 1, 2, 3, 0, 0])

练习4:多条件筛选

numpy读取本地数据

score_data = np.loadtxt("D:\scores.csv",delimiter=",",skiprows=1)

筛选出 成绩 大于60 并且 小于80 的数据

score_data[(score_data>60) & (score_data<80)]
# array([73., 62., 73., 67., 65., 79., 69., 72., 73., 77., 71., 74., 77.,67.])

筛选出 成绩 大于80 并且 小于90 的数据

score_data[(score_data>80) & (score_data<90)]
# array([83., 82., 89., 88., 87., 81.])

筛选出 成绩 大于90 的数据

score_data[score_data>90]
# array([93., 98., 99., 96., 93., 96., 95.])

注:numpy多条件筛选
交集:用 &* 连接,两边的条件有优先级最好加括号
并集:用 +| 连接,两边的条件有优先级最好加括号

已标记关键词 清除标记
相关推荐
©️2020 CSDN 皮肤主题: 数字20 设计师:CSDN官方博客 返回首页