F的样子如下图:
图中小框框就是visual word 是真的是一个维度feature,通过visual word可以抽这个image特征。把x,y带进去φ()函数里,得到一个vector,vector里边属性随便定。这些特征非常弱很难做到凉宫春日的检测。如下图。
要想抽出很好的feature,那就得用deep learning network(例如CNN抽取image里的特征)抽取特征。输出的vector可以很好代表bouning box里的东西。google做object detection 是deep learning + structure learning来做的。
deep learning 抽取特征,structure learning 进行训练。
在Summarization、retrieval应用。
第二个难题假设已经softmax。
第三个难题。就是找w使下边条件满足,正确的y带进去大过所有其他的错误的y带进去的值。
训练时操作:带进去输出多维的vector特征决定一个点。例如如下图例子,框正确的是红色的点,框在其他地方是蓝色的。正确红色的点只有一个。训练找到一个w与空间上的点(feture vector)做内积计算,点到w越近内积值越大。自己形状和自己比较。
过程如下图所示。w也是多维的vector。
只要w存在,用下边这个算法可以找到w。
训练过程:举例子解释上边的算法:初始化w等于0
随机选择一个train data 点x,y。计算使function最大的y浪线,得出来不等于label,所以进行w更新,俩个特征进行相减如下图 。
同时满足俩种圆圈和星号都找到最大的,w停止更新。不会更新,停止trian。
获取以上文本PPT请点击这里
Structured Learning-Linear Model
最新推荐文章于 2021-01-29 22:34:21 发布