在计算机相关专业中如何切入一个“新的课题”

1、先做一个survey(relativelydetailed menu)

Overviewcongnition、Searchsummary/overview

北京大学:张志华 《机器学习导论》、《统计机器学习》

综述网址:https://www.nowpublishers.com/Journal

捷径:阅读别人的survey,梳理所在小方向的发展脉络,快速定位

2、搜索与定位 紧密结合的一系列顶级论文(20篇)Survey-menu

3、多做实验,精通一门语言python/matlab

搜索源代码的能力:github/google

Check author’s homepage

重现代码

跑别人代码:数据准备工作

机器学习样本:UCI Data Set

Logistic regression(classifier)

Naive Bayes 朴素贝叶斯

SVM

Deep forest:冯~

跑代码--发现问题,抓住根本

促进你深入思考

4、如何深入思考

(1)     实验结果,详细分析实验结果

Evaluation measures:accuracy,error,RMSE,confusionmatrix, kappa,AUC,recall,precision,……

Imbalance:

10 samples -- class 1

90 samples -- class 2   90%

(2)数据准备工作

(3)代码阅读能力

对应:equation1,equation2

Lines corresponding to equation1

Lines corresponding to equation2

吃透,看到方程,知道如何组织样本,如何编写对应的代码

5、如何发现“新的”问题:“蝗虫式”做研究

(1)     挖井法:

A:2D tracking method  B:3D tracking method

C:propose 2.5D tracking method

1D,2D,3D

(2)    组合法

A,B     Propose A+B

(3)    Stacking

B,A->A(B)

B-pre-procession A

(4)    Ensembles

A   manyA(random)>>A

“Boosting.....”

Ensemble CNN

(5)    Batching learning(静态学习)—> Onling learning(动态增量/在线式学习)

Optimization method(onling convex optimization)

Convex optimization based algorithms

Online convex optimization based algorithms

Onling SVM、Onling multiple kernel methods、Online gaussian process、Online...

Batching learning(静态学习):W=algorithm(data)

Online learning: W(t)=W(t-1)+delta(...)

=algorithm(data(t),w(t-1))

(6)    张冠李戴法

Model -- (A,B)

A-C  B-D

New Model - (C,B)

New Model - (C,D)

FuzzyA ,fuzzy B

K-means -- crisp classification0,1

0.3  0.7  class 2

Fuzzy k-means、fuzzy SVM、 fuzzy RBF、fuzzy decision tree、fuzzzy aprori、fuzzy

Feature extractor(SIFT,CNN,deep replace)

SVM :support vector machine

Kernel(low dimension —> high dimension)

非线性结果->线性结果

Kernel space,linear methods

Nolinear effectives,kernel...

(7)    ensemble...ensemble...          Stacking

(8)    Bayesian化

(9)    Large scale化

Big data

Method/model,面对海量样本

SVM,数据处理上限为10G

Parrelle/distributed computing

Distributed model、distributed SVMs、distributed CNN(tf,pytorch,coffee2,支持分布式)

6、可选择研究方向

(1)    以数据结构为切入点,做一些工作

Hashing         HABIR 李武军,兰州大学,learning to Hash

(2)    提升速度

①       Large scale high dimensional

②       Dimension reduction

③       Sketching

Approximation    北京大学,张志华教授,王树森(伯克利)

                                                                                                                                      all by Mr.Tang&zzp_wind&me

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值