AI Engineer Toolbox
Back to course

Stage 5 / Chapter 20

第20章 RNN与序列建模

目标

掌握时序数据的处理方法。

---

必学内容

RNN 前向传播

a<t> = g(W_aa * a<t-1> + W_ax * x<t> + b_a)
y<t> = g(W_ya * a<t> + b_y)

RNN 类型

一对一:标准神经网络
一对多:音乐生成
多对一:情感分类
多对多:机器翻译

GRU

# 更新门 + 重置门
# 解决长程依赖问题

LSTM

# 遗忘门 + 更新门 + 输出门
# 记忆单元 c<t> 直接传递

---

必须真正理解

为什么标准RNN有梯度消失

W_aa 连乘多次 → 指数级放大/缩小

LSTM 如何解决

记忆单元 c<t> 有加法路径
梯度可以直接流过,不受乘法影响

---