自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

  • 博客(10)
  • 收藏
  • 关注

原创 OpenCV Android 摄像头满屏和翻转问题

修改:CameraBridgeViewBase.java类的deliverAndDrawFrame(CvCameraViewFrame frame)方法:/** * This method shall be called by the subclasses when they have valid * object and want it to be delivered to external client (via callback) and * then dis

2021-03-25 16:30:03 354

原创 强化学习公式推导(Actor-Critic)

PG算法是对整个马尔科夫链(也就是每个trajectory)进行期望计算,最终推导的得到的公式如下:▽θRθ‾=Eτ∼πθ(τ){∑t=1T▽θlog[πθ(at∣st)]}∗{∑t=1Tr(st,at)}(1)\tag{1}\triangledown_{\theta} \overline{R_\theta}= E_{\tau \sim \pi_{\theta}(\tau)}\{\sum_{t=1}^T \triangledown_{\theta}log[\pi_{\theta}(a_t|s_t)]\

2020-10-21 12:01:36 1182

原创 强化学习-随机策略梯度(Policy-Base)

πθ(a∣s)=π(a∣s,θ)=Pr{At=a∣St=s,θt=θ}(1)\tag 1\pi_{\theta}(a|s)=\pi(a|s,\theta)=P_r\{A_t=a|S_t=s,\theta_t=\theta\}πθ​(a∣s)=π(a∣s,θ)=Pr​{At​=a∣St​=s,θt​=θ}(1)其中时刻ttt,环境状态为sss,参数为θ\thetaθ,输出动作aaa的概率为PrP_rPr​智能体与环境做一次回合的动作轨迹:τ={s1,a1,s2,a2,......,st,at,s.

2020-10-10 11:43:03 1564

转载 tensorflow张量运算

张量(tensor)可以说是TensorFlow的标志, 因为整个框架的名称TensorFlow就是张量流的意思。TensorFlow程序使用tensor数据结构来代表所有的数据。 计算图中, 操作间传递的数据都是Tensor。可以把tensor看为一个n维的数组或列表, 每个tensor中包含了类型(type) 、 阶(rank) 和形状(shape) 。rank(阶) 指的就是维度。 张量的阶和矩阵的阶并不是同一个概念, 主要是看有几层中括号。 例如, 对于一个传统意义上的3阶矩阵a=[[

2020-07-22 10:05:54 1237

原创 决策树(ID3,ID4.5,CART)&随机森林

决策树信息量信息熵信息增益信息增益率基尼系数剪枝随机森林样本集合随机样本特征随机

2020-07-22 10:01:04 1869 1

原创 矩阵及其运算和相关性质

矩阵及其运算矩阵的定义定义:由m×nm \times nm×n个数aij(i=1,2,...,m;j=1,2,...,n)a_{ij}(i=1,2,...,m;j=1,2,...,n)aij​(i=1,2,...,m;j=1,2,...,n)排成的mmm行nnn列的数表,称为mmm行nnn列矩阵,简称m×nm \times nm×n矩阵A=(a11a12...a1na21a22...a2n............am1am2...amn)A=\begin{pmatrix} a_{11} &a

2020-06-15 17:35:21 2108

原创 行列式及其运算和性质

行列式特别注意,行列式虽然表达为一系列数字的数表,但是其本质式一个数,这个跟矩阵有本质的区别.二阶行列式D=∣a11a12a21a22∣=a11a22−a12a21D=\begin{vmatrix}a_{11}&a_{12}\\a_{21}&a_{22}\end{vmatrix}=a_{11}a_{22}-a_{12}a_{21}D=∣∣∣∣​a11​a21​​a12​a22​​∣∣∣∣​=a11​a22​−a12​a21​三阶行列式D=∣a11a12a13a21a2

2020-06-13 23:13:23 2635

原创 SVM分类算法推导

SVM算法推导(先以二维平面点为例)待解决问题:设有个样本集合X={(x11,x21),(x12,x22),(x13,x23),...,(x1n,x2n)}x1i,x2i∈RX=\{(x_{11},x_{21}),(x_{12},x_{22}),(x_{13},x_{23}),...,(x_{1n},x_{2n})\} \kern{1em} x_{1i},x_{2i} \isin RX={(x11​,x21​),(x12​,x22​),(x13​,x23​),...,(x1n​,x2n​)}x1i​,x

2020-06-11 14:25:23 398

原创 拉格朗日&KKT条件极值求解

拉格朗日乘数法(等式约束条件极值)基础用法设,若x,yx,yx,y满足x+3y=5xyx+3y=5xyx+3y=5xy,求3x+4y3x+4y3x+4y的最小值:构建拉格朗日函数:L(x,y,λ)=3x+4y+λ(x+3y−5xy)L(x,y,\lambda)=3x+4y+\lambda(x+3y-5xy)L(x,y,λ)=3x+4y+λ(x+3y−5xy)分别对L(x,y,λ)L(x,y,\lambda)L(x,y,λ)中的x,y,λx,y,\lambdax,y,λ求导,并令偏导数等于0,用

2020-06-11 10:52:45 3993

原创 最小二乘法拟合任意连续曲线推导

最小二乘法详细推导过程假设给定一些列散列值(训练数据集)记为:D=(x1,y1),(x2,y2),(x3,y3)...(xn,yn)D={(x_1,y_1),(x_2,y_2),(x_3,y_3)...(x_n,y_n)}D=(x1​,y1​),(x2​,y2​),(x3​,y3​)...(xn​,yn​)需要找到找到一个函数:y=f(x)=ax+b使得$f(x)$函数尽可能拟合$D$,也就是需要找到一个$a$和$b$的值,使得将数据集全部带入到$f(x)$中,让等式左边和右边的误差值最小:

2020-06-11 10:46:19 1222

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除