公式内容的语法可以参考 这里
-
行内公式
-
语法格式
$公式文本$
-
示例
避免了$\pi(s)=\underset{a}{\arg\max}Q(s,a)$ 策略导致的DQN参数过大难收敛的问题
效果
避免了 π ( s ) = arg max a Q ( s , a ) \pi(s)=\underset{a}{\arg\max}Q(s,a) π(s)=aargmaxQ(s,a) 策略导致的DQN参数过大难收敛的问题
-
在Typora中
在Typora的默认设置中不支持行内公式,需要在
文件 =》偏好设置 =》Markdown =》Markdown 语法扩展
下选中内联样式
的选项
-
-
行间公式
-
语法格式
$$ 公式文本 $$
-
示例
最终由 $$ Q(s,a;\theta,\alpha,\beta)=V(s;\theta,\beta)+\big(A(s,a;\theta,a)-\max\limits_{a'\isin|A|}A(s,a';\theta,\alpha)\big) $$ 计算出最终Q值
效果
最终由
Q ( s , a ; θ , α , β ) = V ( s ; θ , β ) + ( A ( s , a ; θ , a ) − max a ′ ∈ ∣ A ∣ A ( s , a ′ ; θ , α ) ) Q(s,a;\theta,\alpha,\beta)=V(s;\theta,\beta)+\big(A(s,a;\theta,a)-\max\limits_{a'\isin|A|}A(s,a';\theta,\alpha)\big) Q(s,a;θ,α,β)=V(s;θ,β)+(A(s,a;θ,a)−a′∈∣A∣maxA(s,a′;θ,α))
计算出最终Q值
-
-
公式内容的语法可以参考 这里