Theano教程：深入理解符号计算与随机数生成

虞熠蝶

于 2025-06-04 09:09:43 发布

阅读量370

点赞数 5

本文链接：https://blog.csdn.net/gitblog_00910/article/details/148416917

版权

Theano教程：深入理解符号计算与随机数生成

Theano Theano was a Python library that allows you to define, optimize, and evaluate mathematical expressions involving multi-dimensional arrays efficiently. It is being continued as aesara: www.github.com/pymc-devs/aesara 项目地址: https://gitcode.com/gh_mirrors/th/Theano

1. Theano基础回顾

Theano是一个强大的Python库，专门用于定义、优化和评估涉及多维数组的数学表达式。它结合了符号计算和数值计算的优势，特别适合深度学习和大规模数值计算任务。

在Theano中，我们首先构建符号计算图，然后编译这个图来生成高效的数值计算函数。这种设计使得Theano能够自动进行各种优化，如表达式简化、内存共享和GPU加速等。

2. 逻辑函数实现

让我们从一个经典的逻辑函数（Logistic Function）示例开始：

import theano
import theano.tensor as T

x = T.dmatrix('x')
s = 1 / (1 + T.exp(-x))  # 标准逻辑函数定义
logistic = theano.function([x], s)

# 测试
print(logistic([[0, 1], [-1, -2]]))

这个例子展示了Theano的几个关键特点：

使用T.dmatrix定义符号变量
构建符号表达式
编译为可执行函数
自动进行元素级运算

逻辑函数还有另一种数学等价形式：

s2 = (1 + T.tanh(x / 2)) / 2
logistic2 = theano.function([x], s2)

两种形式在数学上是等价的，Theano都能正确处理。

3. 多输出函数

Theano支持同时计算多个输出，这在需要计算多个相关量时非常高效：

a, b = T.dmatrices('a', 'b')
diff = a - b
abs_diff = abs(diff)
diff_squared = diff**2

f = theano.function([a, b], [diff, abs_diff, diff_squared])

调用这个函数会同时返回三个计算结果，避免了重复计算的开销。

4. 参数默认值设置

Theano支持为函数参数设置默认值，类似于Python函数：

from theano import In

x, y = T.dscalars('x', 'y')
z = x + y
f = function([x, In(y, value=1)], z)  # y默认值为1

使用In类可以更精细地控制函数参数的行为，包括：

设置默认值
指定参数名称
控制参数顺序

5. 共享变量与状态维护

共享变量(Shared Variables)是Theano中一个强大的特性，它允许函数维护内部状态：

from theano import shared

state = shared(0)  # 初始值为0的共享变量
inc = T.iscalar('inc')
accumulator = function([inc], state, updates=[(state, state+inc)])

关键点：

shared()创建共享变量
updates参数指定如何更新共享变量
状态可以在函数调用间保持
多个函数可以共享同一个变量

共享变量特别适合实现需要维护状态的算法，如参数更新、计数器等。

6. 随机数生成

Theano中的随机数生成有其独特的设计，因为它需要适应符号计算的特点：

from theano.tensor.shared_randomstreams import RandomStreams

srng = RandomStreams(seed=234)
rv_u = srng.uniform((2,2))  # 均匀分布
rv_n = srng.normal((2,2))   # 正态分布

f = function([], rv_u)
g = function([], rv_n, no_default_updates=True)  # 不更新随机状态

随机数生成的关键特性：

每个随机变量有自己的随机数流
默认每次调用会更新随机状态
可以通过no_default_updates禁用自动更新
支持种子设置和状态控制

7. 随机状态管理

Theano提供了多种方式来控制随机数生成器的状态：

单独设置随机变量种子：

rng_val = rv_u.rng.get_value(borrow=True)
rng_val.seed(89234)
rv_u.rng.set_value(rng_val, borrow=True)

批量设置种子：

srng.seed(902340)  # 设置所有关联的随机变量

在函数间共享随机状态：

# 保存状态
state_after_v0 = rv_u.rng.get_value().get_state()

# 恢复状态
rng = rv_u.rng.get_value(borrow=True)
rng.set_state(state_after_v0)
rv_u.rng.set_value(rng, borrow=True)

8. 函数复制与状态隔离

Theano允许复制已编译的函数，这在需要相似但独立的状态时非常有用：

new_state = theano.shared(0)
new_accumulator = accumulator.copy(swap={state:new_state})

# 创建不更新状态的副本
null_accumulator = accumulator.copy(delete_updates=True)

这种机制避免了重新编译相同计算图的开销，同时允许灵活的状态管理。