这是一个机器学习读书会的私人Challenge
数据来自于我个人遇到的一些回归问题
顺便在这里也放一份
目标是实现一个几百或者几千维到几十维的回归
出于相互交流的目的我把其中的一部分数据
公开出来,征询更好的解答。并会请两个表现
最好的算法的作者吃一次饭。如果不在读书会
的人进入前三的话我也会额外请你吃饭的TAT
截止日期
这个好像挺重要的,等我开ICCV回来吧,
定在12月20日吧
下载
文件夹的链接
http://pan.baidu.com/s/19seyW
包含测试框架 RegressionChallenge
和数据集的数据
提交:
测试的框架我写在main.m
大家可以在regressor下面新建一个自己方法的文件夹
并且在main.m中修改第12行的方法名
和第14,15行的训练与测试的函数指针(修改成自己的函数名)
训练函数接口
model = your_trainMethod( feature, target)
feature是n * 特征维度的double矩阵
target 是n * 目标维度的double矩阵
model是任意一个结构体
测试函数接口
response = your_predictMethod( model, feature );
response 是n * 目标维度的double矩阵
代表你的模型的输出
model 代表你的模型
feature是n * 特征维度的double矩阵
框架下面我已经写了一个岭回归和一个PCA之后岭回归
的样例,大家可以先跑通样例。
算法完成后把你的算法包和函数指针的写法发给我就行了
有什么bug请及时联系我
评价
评价原则上采用l_2度量
不过我的样例只给了一个l_1的
数据:
数据存储在/data/下面的一些mat里,
框架的压缩包里面已经包含了一个数据集Celebrity
对应一个640维到10维的回归问题,包含16000个样例
TrainCelebrity是可以使用的训练数据
ValiCelebrity是供大家自己测试的测试数据
大家可以汇报在Vali上测试的结果来相互比较
除此之外共享的文件夹里面还有一个SparseHelen
的数据集大家也可以下载了放在data里面
我还会陆续更新其他的数据集
此外我还会准备同样维度规模的公共的测试数据来进行测试。
数据的真实来源:
其实这个feature是机器视觉里面的SIFT feature,
而对应的问题是CVPR13的一篇论文
X.Xiong, Fernando.D.Torre, Supervised Descent Method and its Applications to Face Alignment
里面涉及一个SIFT feature到pose的拟合
实际上就是这次challenge的数据
在论文里面作者使用了岭回归,我不清楚有没有更
powerful的解法,所以放在这里大家试一下。