ADL49学习体会

第一次出去学习确实有点小紧张,还好不是我一个人。实验室这么早就给了我一次外出学习的机会,我还是很激动的。这次学习的时长是三天,主题是社交网络与数据挖掘。在这里,我总结一下这次学习ADL49期的心得体会。

第一天在会场报道,人确实不少,差不多有三百多人,有学生也有老师。上午就是剑桥大学的教授Cecilia,第一场就是英文,听起来还是很吃力的,主要是因为我的英文水平太差的,但是根据PPT还是听懂了一些的。她主要讲的是在社交网络中加入了时空的概念,即社交网络在时间以及地点维度上的变化,一开始她介绍了社交网络中结点的一些中心性(Centrality),包括Degree Centrality,Betweenness Centrality,Closeness Centrality,Eigenvector Centrality,Katz Centrality,她还强调了在网络中各结点的三角形关系是很重要的。后面就着重讲了时空上的社交网络,在社交网络中考虑了时空,之前我还没有听说这个,也许是我刚入门知道的太少,不管怎么说还是长知识了。总得来说她讲得还是蛮清楚的,例子也有。

下午的讲者是诺亚方舟实验室的李航,题目是机器学习算法及其在社交网络中的应用,其中的机器学习算法很多都是我们在暑期学习过的,听起来就很带劲。一开始他介绍了他们实验室做的一个微博机器人(小诺_Noah),它能从一群机器学习领域的微博中转发和机器学习相关的微博,给出一些简单的评论,我也去他的微博看了下,确实不错,感觉不出来是一个机器在发微博。然后他介绍了learning to rank,learning to match。当他讲到learning to rank的时候我就想起了我们暑假做的百度Task1,它们之间有很大的相似性,同样是需要对训练数据进行标注,然后生成特征,然后训练分类器,最后在测试,大的方向我们是没错的,但是一想到那个结果,用马师兄的话说就是“心都碎了”。一来是百度的数据本身标注的不是很好,二来还是我们的特征没有区分度。所以当李航在讲特征生成的时候我擦亮了眼睛,但是他只是粗略的带过,但是他的PPT上还是有一些特征值得参考的。他还推荐了他自己写的一本书Learning to Rank for Information Retrievaland Natural Language Processing,相关细节应该都在上面。一般在搜索中,先做matching得到候选集,然后在候选集中做ranking。很明显matching要比ranking要难做,因为matching中涉及到语义等。

第二天上午是康奈尔大学教授John Hopcroft介绍社交网络数据挖掘中的数学知识,理论方面的知识比较多,所以当时听得时候云里雾里,公式太多,例子很少,感觉难度也有点大。介绍了一种处理超大网络图的处理方法,主要是解决了超大矩阵之间的乘法运算。

下午是清华大学的唐杰介绍社会网络分析的计算模型。在他的讲述过程中,首先给出了一大堆的图表,也就是实验结果,然后对这些图表进行分析,感觉前面讲的没什么用。但是他讲到的一些方法还是很前沿的,虽然有一些听得不是很明白。他介绍的那些社交网络的实验结果都是有实际意义的,他研究的问题还是有很大的价值的。同时他也强调了网络中的三角关系,如朋友的朋友是朋友,敌人的敌人是朋友等。而且当他讲到他的算法在处理数万结点的网络时,用的时间是秒级的,当场的很多人都觉得不可思议,而这时我想到了我们Task1,生成1万个实体构成的1亿个pair对的结果用了半天的时间,这差距是很大啊,我感觉主要是他用了分布式计算,这样大大地提高了计算的效率。他还提了他们实验室做的一个网站应用Arnetminer,它展现的是研究学者门构成的社交网络,利用学者们发表的学术文章,因为这些文章之间有引用关系等,这就构成了一个社交网络,很有新意。

第三天的讲者是罗格斯大学的教授熊辉,他讲的是大数据分析及其在商务智能方面的应用,他讲述的所有问题都是实实际际的商业应用问题,让我更深地体会到了数据挖掘在社交网络中的实际应用,如何运用数据挖掘的知识来解决实际的问题。从他的讲解中,我感觉到数据挖掘是一个很长久的课题,应用前景好,也有持久性。更有意思的是,他还讲到了周易,用卦象来分析一个人的命运。他更是在周易的基础上加入了自己的观点。通过卦象得出的是一个确定值,而还有另外一个方面也决定了人的命运,那就是后天的改变。如果一个人他一直都没有改变,那么他的命运就基本上和周易中说的差不多;而如果他一直在改变,那么卦象所决定的命运所占的比重就很小很小了。这是很有哲理的,所以我们需要不断学习,不断地改变自己,来最大化自己的命运。同时他还分享了他做研究的方法,面对一个问题,首先进行周密的思考,当把所有的问题都弄清楚之后,这件事差不多已经做了一半了。而我们处理问题,大多都是想个大概,然后就开始动手做,在做的过程中突然会遇到各种各样的问题,并不能像熊教授一样,主要是因为我们的认知还没有上升到一定的高度吧。

最后,非常感谢实验室能给我们这次学习的机会,经过这三天的学习,我认识到需要学习的东西还是有很多很多的。他们研究的问题很有新意,很有应用价值。现在我们已经知道了大的方向,他们研究的问题中,有很多的东西是和我们现在处理的问题差不多的,所以他们的一些方法是值得我们仔细的学习的。我觉得这些东西应该到用的时候再拿过来细读效果还是比较好的。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值