Alan Yuille 讲座总结

上午有AY关于"计算机视觉和深度学习综述性工作介绍"的talk,简单记录如下,有时间补充。

总体感受 :公司里比在学校小实验室瞎搞学得多得多

主题:Computational Cognition, Vision and learning & deep nets

印象最深的 The size of the dataset depends on the complexity of the task, the variability of the images and the classes.


  • 一些概念记下来,需要后期补充:

        1. Gauss 1800

        2. conceptual model

        3. fully conv deep net (Deeplab)

        4. fully / weakly supervised      

  • 一些领域的介绍:

1. Occulusion detection

概念记录:

(1) occulusion boundary detect & bordeer-ownship

(2) 数据:Pascal


2.  Human pose detection & semantic segmentation

(1) fully-connected CRF (conditional random  fields)


3. Detecting symmetry axes

(1) Wei Shen st al., 2018


4. Siamese-Triplet Net: to learn similarity

(1) Tai Sing Lee collaboration, ICLR 2017

(2) 用于transfer learning


5. Text-captioning by m-RNN/LSTM

(1) Junhua Mao, ICLR 2015

(2) 介绍:

a. 从图中自动生成语言描述;

b. Text: m-RNN / image:CNN;

c. 结构大概是:

    embedding 1-> embedding 2 -> RNN-> multimodel(这里有引入CNN)-> Softmax

(3) 会记住一些经常一起出现的词,举例:长颈鹿和树

(4) 现在这个task还是很难: 数据获取难/目前只在部分数据集上做成,迁移到别的数据集就不行


6. FELIX project:CT cancer detect

医疗数据,数据集一般都比较小

(1) multi-organ segmentation

(2) Dice similarity coefficient

(3) PDAL detection/segmentation

  • transfer learning

背景: 没有足够的annotated training data -> transfer learning

三个步骤:

1. 找closed problem B with enough training data

2. deep net on problem B

3. fine tune for A


举个例子:医疗上pain assessment from faces, 借用 face recognition

Feng Wang , ICIP 2017

一些记录:

(1) make this as a regression task

(2)CNN-> dense layer -> regression loss/ center loss 这两个loss分别代表什么?

(3)avoid overfitting: dense layer 神经元少一点


  • few shot learning

(1) key idea: relate the activations to the weights

(2) learn the mapping

这篇是乔思远的论文,本科同学,赞叹大神。


  •   deep net and random forest
这部分没仔细听了,有拍照



















(3) 参考利用下面的程序代码,完成代码注释中要求的两项任务。 import re """ 下面ref是2020年CVPR的最佳论文的pdf格式直接另存为文本文件后, 截取的参考文献前6篇的文本部分。 请利用该科研文献的这部分文本,利用正则表达式、字符串处理等方法, 编程实现对这6篇参考文献按下面的方式进行排序输出。 a.按参考文献标题排序 b.按出版年份排序 """ ref = """[1] Panos Achlioptas, Olga Diamanti, Ioannis Mitliagkas, and Leonidas Guibas. Learning representations and generative models for 3D point clouds. In Proc. ICML, 2018 [2] Pulkit Agrawal, Joao Carreira, and Jitendra Malik. Learning to see by moving. In Proc. ICCV, 2015 [3] Peter N. Belhumeur, David J. Kriegman, and Alan L. Yuille. The bas-relief ambiguity. IJCV, 1999 [4] Christoph Bregler, Aaron Hertzmann, and Henning Biermann. Recovering non-rigid 3D shape from image streams. In Proc. CVPR, 2000 [5] Angel X. Chang, Thomas Funkhouser, Leonidas Guibas. Shapenet: An information-rich 3d model reposi-tory. arXiv preprint arXiv:1512.03012, 2015 [6] Ching-Hang Chen, Ambrish Tyagi, Amit Agrawal, Dy-lan Drover, Rohith MV, Stefan Stojanov, and James M. Rehg. Unsupervised 3d pose estimation with geometric self-supervision. In Proc. CVPR, 2019""" ref_str = re.sub(r'\[([0-9]{1})\]', r'$[\1]', ref) # 添加分隔$ print(ref_str) #脚手架代码 ref_str_2 = re.sub(r'([a-zA-Z]{2})\.', r'\1.#', ref_str) # 添加分隔# print(ref_str_2) #脚手架代码 ref_str2 = ref_str_2.replace("\n", "") ref_list = ref_str2.split("$") print(ref_list) #脚手架代码 [提示: 排序可以采用内置函数sorted(),语法如下: sorted(iterable, /, *, key=None, reverse=False), 注意掌握形式参数中带“/”和“*”的用途]
05-26
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值