【joyful pandas 01】基础知识03

最新推荐文章于 2024-07-27 12:20:46 发布

韩梅梅与李华的幸福生活

最新推荐文章于 2024-07-27 12:20:46 发布

阅读量230

点赞数

分类专栏： python学习文章标签： python numpy 算法

本文链接：https://blog.csdn.net/weixin_45389860/article/details/111262735

版权

python学习专栏收录该内容

8 篇文章 0 订阅

订阅专栏

一些基础练习题

附上前面的学习笔记链接

https://blog.csdn.net/weixin_45389860/article/details/111163226

https://blog.csdn.net/weixin_45389860/article/details/111241656

1.利用列表推导式矩阵乘法

M1 = np.random.rand(2,3)
M2 = np.random.rand(3,4)
res = np.empty((M1.shape[0],M2.shape[1]))
for i in range(M1.shape[0]):
    for j in range(M2.shape[1]):
        item = 0
        for k in range(M1.shape[1]):
            item += M1[i][k] * M2[k][j]
        res[i][j] = item
((M1@M2 - res) < 1e-15).all() # 排除数值误差

其三重循环表达式应该如上图所示，将以上的表达式转化成列表推导式的形式：

注意一下是我的错误示例

M1 = np.random.rand(2,3)
M2 = np.random.rand(3,4)
res = [sum([M1[i][k]*M2[k][j]]) for i in range(M1.shape[0]) for j in range(M2.shape[1]) for k in range(M1.shape[1])]
# 检验是否通过

这里遇到一个问题,成功生成了这段list，但是后面想一下，list可以和ndarray数据进行运算嘛？

以上是一种错误的实例，由于各个循环之间没有嵌套括号分开来导致其没有实现在列表推导式中的循环嵌套：一下是纠正后的实例：

np.random.seed(0)
M1 = np.random.rand(2,3)
M2 = np.random.rand(3,4)
res = [[sum([M1[i][k] * M2[k][j] for k in range(M1.shape[1])]) for j in range(M2.shape[1])] for i in range(M1.shape[0])]
((M1@M2 - res) < 1e-15).all()
res

True

2.更新矩阵

设矩阵 $A_{m×n}$ ，现在对 $A$ 中的每一个元素进行更新生成矩阵 $B$ ，更新方法是 $B_{ij}=A_{ij}\sum_{k=1}^n\frac{1}{A_{ik}}$ ，例如下面的矩阵为 $A$ ，则 $B_{2,2}=5\times(\frac{1}{4}+\frac{1}{5}+\frac{1}{6})=\frac{37}{12}$ ，请利用 Numpy 高效实现。
latex公式乱码，mark一下

先让憨憨来曲解曲解题意：

挂一张大神的理解
来自datawhale 黄元帅

按照公式 $B_{ij}=A_{ij}\sum_{k=1}^n\frac{1}{A_{ik}}$ ，先是对A数组按照行进行求和，然后再与相应的数值进行计算

A = np.arange(1,10).reshape(3,-1)
B = A*(1/A).sum(axis=1).reshape(-1,1)
B

array([[1.83333333, 3.66666667, 5.5       ],
       [2.46666667, 3.08333333, 3.7       ],
       [2.65277778, 3.03174603, 3.41071429]])

mark 一下自己烦的错误，一开始没有理解的内容是，这里的整个表达公式，当然应该是一个完整的公式应该被优先表达，这里的(1/A).sum(axis=1).reshape(-1,1)实际上是一个整体的形式被表达出来。

end this

卡方统计量

设矩阵 $A_{m\times n}$ ，记 $B_{ij} = \frac{(\sum_{i=1}^mA_{ij})\times (\sum_{j=1}^nA_{ij})}{\sum_{i=1}^m\sum_{i=1}^nA_{ij}}$ ，定义卡方值如下：
$\chi^2 = \sum_{i=1}^m\sum_{j=1}^n\frac{(A_{ij}-B_{ij})^2}{B_{ij}}$
请利用Numpy对给定的矩阵 $A$ 计算 $\chi^2$

np.random.seed(0)
A = np.random.randint(10, 20, (8, 5))
B = (A.sum(axis=0)*A.sum(axis=1).reshape(-1,1))/A.sum()
K2 = ((A-B)**2/B).sum()
K2

11.842696601945802

注意上面B公式的实现，是通过矩阵的乘法，这方面的话，还得去补一补线代的课。其他的到还好没什么东西。

改进矩阵的计算性能

设 $Z$ 为 $m \times n$ 的矩阵， $B$ 和 $U$ 分别是 $m \times p$ 和 $p \times n$ 的矩阵， $B_i$ 为 $B$ 的第 $i$ 行， $U_j$ 为 $U$ 的第 $j$ 列，下面定义 $\displaystyle R=\sum_{i=1}^m\sum_{j=1}^n\|B_i-U_j\|_2^2Z_{ij}$ ，其中 $\|\mathbf{a}\|_2^2$ 表示向量 $a$ 的分量平方和 $\sum_i a_i^2$ 。

现有某人根据如下给定的样例数据计算 $R$ 的值，请充分利用Numpy中的函数，基于此问题改进这段代码的性能。

## 以下是提供的原方法
np.random.seed(0)
m, n, p = 100, 80, 50
B = np.random.randint(0, 2, (m, p))
U = np.random.randint(0, 2, (p, n))
Z = np.random.randint(0, 2, (m, n))
def solution(B=B, U=U, Z=Z):
    L_res = []
    for i in range(m):
        for j in range(n):
            norm_value = ((B[i]-U[:,j])**2).sum()
            L_res.append(norm_value*Z[i][j])
    return sum(L_res)
solution(B, U, Z)

下面对其进行改进

由于前面提供的分量平方和的公式，可以将式子改为

$Y_{ij} = \|B_i-U_j\|_2^2$ ，则 $\displaystyle R=\sum_{i=1}^m\sum_{j=1}^n Y_{ij}Z_{ij}$

因此后面讨论 $Y_(ij)$ 是怎么推导出来的

latex公式乱码，mark一下

因此这里将改进公式应用于矩阵的乘法

(((B**2).sum(1).reshape(-1,1) + (U**2).sum(0) - 2*B@U)*Z).sum()

连续整数的最大长度

输入一个整数的Numpy数组，返回其中递增连续整数子数组的最大长度，正向是指递增方向。例如，输入[1,2,5,6,7]，[5,6,7]为具有最大长度的连续整数子数组，因此输出3；输入[3,2,1,2,3,4,6]，[1,2,3,4]为具有最大长度的连续整数子数组，因此输出4。请充分利用Numpy的内置函数完成。（提示：考虑使用nonzero, diff函数）

f = lambda x:np.diff(np.nonzero(np.r_[1,np.diff(x)!=1,1])).max()
f([1,2,5,6,7])
f([3,2,1,2,3,4,6])

在使用np.diff(x)!=1进行判断是，获得是数据是布尔值，在使用列表合并的时候，[1,np.diff(x),1]输出的结果依旧是有整数有布尔array，但是使用了np.r_之后获得数据中原来的布尔array变成了数字。

其中的方法是妙的。

对其中的每一步分别拆解，需要知道的是使用np.r_之后，布尔数据会自动转化为数值数据

其中的方法是妙的。

对其中的每一步分别拆解，需要知道的是使用np.r_之后，布尔数据会自动转化为数值数据。

韩梅梅与李华的幸福生活

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
【joyful pandas 01】基础知识03

这是python基础的一部分练习题。包括列表推导式的使用、numpy的具体应用，内容丰富详实。
复制链接

扫一扫

专栏目录