- 博客(10)
- 收藏
- 关注
原创 OpenCV Android 摄像头满屏和翻转问题
修改:CameraBridgeViewBase.java类的deliverAndDrawFrame(CvCameraViewFrame frame)方法:/** * This method shall be called by the subclasses when they have valid * object and want it to be delivered to external client (via callback) and * then dis
2021-03-25 16:30:03
354
原创 强化学习公式推导(Actor-Critic)
PG算法是对整个马尔科夫链(也就是每个trajectory)进行期望计算,最终推导的得到的公式如下:▽θRθ‾=Eτ∼πθ(τ){∑t=1T▽θlog[πθ(at∣st)]}∗{∑t=1Tr(st,at)}(1)\tag{1}\triangledown_{\theta} \overline{R_\theta}= E_{\tau \sim \pi_{\theta}(\tau)}\{\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)]\
2020-10-21 12:01:36
1182
原创 强化学习-随机策略梯度(Policy-Base)
πθ(a∣s)=π(a∣s,θ)=Pr{At=a∣St=s,θt=θ}(1)\tag 1\pi_{\theta}(a|s)=\pi(a|s,\theta)=P_r\{A_t=a|S_t=s,\theta_t=\theta\}πθ(a∣s)=π(a∣s,θ)=Pr{At=a∣St=s,θt=θ}(1)其中时刻ttt,环境状态为sss,参数为θ\thetaθ,输出动作aaa的概率为PrP_rPr智能体与环境做一次回合的动作轨迹:τ={s1,a1,s2,a2,......,st,at,s.
2020-10-10 11:43:03
1564
转载 tensorflow张量运算
张量(tensor)可以说是TensorFlow的标志, 因为整个框架的名称TensorFlow就是张量流的意思。TensorFlow程序使用tensor数据结构来代表所有的数据。 计算图中, 操作间传递的数据都是Tensor。可以把tensor看为一个n维的数组或列表, 每个tensor中包含了类型(type) 、 阶(rank) 和形状(shape) 。rank(阶) 指的就是维度。 张量的阶和矩阵的阶并不是同一个概念, 主要是看有几层中括号。 例如, 对于一个传统意义上的3阶矩阵a=[[
2020-07-22 10:05:54
1237
原创 矩阵及其运算和相关性质
矩阵及其运算矩阵的定义定义:由m×nm \times nm×n个数aij(i=1,2,...,m;j=1,2,...,n)a_{ij}(i=1,2,...,m;j=1,2,...,n)aij(i=1,2,...,m;j=1,2,...,n)排成的mmm行nnn列的数表,称为mmm行nnn列矩阵,简称m×nm \times nm×n矩阵A=(a11a12...a1na21a22...a2n............am1am2...amn)A=\begin{pmatrix} a_{11} &a
2020-06-15 17:35:21
2108
原创 行列式及其运算和性质
行列式特别注意,行列式虽然表达为一系列数字的数表,但是其本质式一个数,这个跟矩阵有本质的区别.二阶行列式D=∣a11a12a21a22∣=a11a22−a12a21D=\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}=a_{11}a_{22}-a_{12}a_{21}D=∣∣∣∣a11a21a12a22∣∣∣∣=a11a22−a12a21三阶行列式D=∣a11a12a13a21a2
2020-06-13 23:13:23
2635
原创 SVM分类算法推导
SVM算法推导(先以二维平面点为例)待解决问题:设有个样本集合X={(x11,x21),(x12,x22),(x13,x23),...,(x1n,x2n)}x1i,x2i∈RX=\{(x_{11},x_{21}),(x_{12},x_{22}),(x_{13},x_{23}),...,(x_{1n},x_{2n})\} \kern{1em} x_{1i},x_{2i} \isin RX={(x11,x21),(x12,x22),(x13,x23),...,(x1n,x2n)}x1i,x
2020-06-11 14:25:23
398
原创 拉格朗日&KKT条件极值求解
拉格朗日乘数法(等式约束条件极值)基础用法设,若x,yx,yx,y满足x+3y=5xyx+3y=5xyx+3y=5xy,求3x+4y3x+4y3x+4y的最小值:构建拉格朗日函数:L(x,y,λ)=3x+4y+λ(x+3y−5xy)L(x,y,\lambda)=3x+4y+\lambda(x+3y-5xy)L(x,y,λ)=3x+4y+λ(x+3y−5xy)分别对L(x,y,λ)L(x,y,\lambda)L(x,y,λ)中的x,y,λx,y,\lambdax,y,λ求导,并令偏导数等于0,用
2020-06-11 10:52:45
3993
原创 最小二乘法拟合任意连续曲线推导
最小二乘法详细推导过程假设给定一些列散列值(训练数据集)记为:D=(x1,y1),(x2,y2),(x3,y3)...(xn,yn)D={(x_1,y_1),(x_2,y_2),(x_3,y_3)...(x_n,y_n)}D=(x1,y1),(x2,y2),(x3,y3)...(xn,yn)需要找到找到一个函数:y=f(x)=ax+b使得$f(x)$函数尽可能拟合$D$,也就是需要找到一个$a$和$b$的值,使得将数据集全部带入到$f(x)$中,让等式左边和右边的误差值最小:
2020-06-11 10:46:19
1222
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人