ADL49学习体会

最新推荐文章于 2020-06-13 11:28:08 发布

marine1ly

最新推荐文章于 2020-06-13 11:28:08 发布

阅读量598

点赞数

分类专栏：学习体会文章标签：数据挖掘社交网络

本文链接：https://blog.csdn.net/marine1ly/article/details/38802407

版权

学习体会专栏收录该内容

1 篇文章 0 订阅

订阅专栏

第一次出去学习确实有点小紧张，还好不是我一个人。实验室这么早就给了我一次外出学习的机会，我还是很激动的。这次学习的时长是三天，主题是社交网络与数据挖掘。在这里，我总结一下这次学习ADL49期的心得体会。

第一天在会场报道，人确实不少，差不多有三百多人，有学生也有老师。上午就是剑桥大学的教授Cecilia，第一场就是英文，听起来还是很吃力的，主要是因为我的英文水平太差的，但是根据PPT还是听懂了一些的。她主要讲的是在社交网络中加入了时空的概念，即社交网络在时间以及地点维度上的变化，一开始她介绍了社交网络中结点的一些中心性（Centrality），包括Degree Centrality，Betweenness Centrality，Closeness Centrality，Eigenvector Centrality，Katz Centrality，她还强调了在网络中各结点的三角形关系是很重要的。后面就着重讲了时空上的社交网络，在社交网络中考虑了时空，之前我还没有听说这个，也许是我刚入门知道的太少，不管怎么说还是长知识了。总得来说她讲得还是蛮清楚的，例子也有。

下午的讲者是诺亚方舟实验室的李航，题目是机器学习算法及其在社交网络中的应用，其中的机器学习算法很多都是我们在暑期学习过的，听起来就很带劲。一开始他介绍了他们实验室做的一个微博机器人（小诺_Noah），它能从一群机器学习领域的微博中转发和机器学习相关的微博，给出一些简单的评论，我也去他的微博看了下，确实不错，感觉不出来是一个机器在发微博。然后他介绍了learning to rank，learning to match。当他讲到learning to rank的时候我就想起了我们暑假做的百度Task1，它们之间有很大的相似性，同样是需要对训练数据进行标注，然后生成特征，然后训练分类器，最后在测试，大的方向我们是没错的，但是一想到那个结果，用马师兄的话说就是“心都碎了”。一来是百度的数据本身标注的不是很好，二来还是我们的特征没有区分度。所以当李航在讲特征生成的时候我擦亮了眼睛，但是他只是粗略的带过，但是他的PPT上还是有一些特征值得参考的。他还推荐了他自己写的一本书Learning to Rank for Information Retrievaland Natural Language Processing，相关细节应该都在上面。一般在搜索中，先做matching得到候选集，然后在候选集中做ranking。很明显matching要比ranking要难做，因为matching中涉及到语义等。

第二天上午是康奈尔大学教授John Hopcroft介绍社交网络数据挖掘中的数学知识，理论方面的知识比较多，所以当时听得时候云里雾里，公式太多，例子很少，感觉难度也有点大。介绍了一种处理超大网络图的处理方法，主要是解决了超大矩阵之间的乘法运算。

下午是清华大学的唐杰介绍社会网络分析的计算模型。在他的讲述过程中，首先给出了一大堆的图表，也就是实验结果，然后对这些图表进行分析，感觉前面讲的没什么用。但是他讲到的一些方法还是很前沿的，虽然有一些听得不是很明白。他介绍的那些社交网络的实验结果都是有实际意义的，他研究的问题还是有很大的价值的。同时他也强调了网络中的三角关系，如朋友的朋友是朋友，敌人的敌人是朋友等。而且当他讲到他的算法在处理数万结点的网络时，用的时间是秒级的，当场的很多人都觉得不可思议，而这时我想到了我们Task1，生成1万个实体构成的1亿个pair对的结果用了半天的时间，这差距是很大啊，我感觉主要是他用了分布式计算，这样大大地提高了计算的效率。他还提了他们实验室做的一个网站应用Arnetminer，它展现的是研究学者门构成的社交网络，利用学者们发表的学术文章，因为这些文章之间有引用关系等，这就构成了一个社交网络，很有新意。

第三天的讲者是罗格斯大学的教授熊辉，他讲的是大数据分析及其在商务智能方面的应用，他讲述的所有问题都是实实际际的商业应用问题，让我更深地体会到了数据挖掘在社交网络中的实际应用，如何运用数据挖掘的知识来解决实际的问题。从他的讲解中，我感觉到数据挖掘是一个很长久的课题，应用前景好，也有持久性。更有意思的是，他还讲到了周易，用卦象来分析一个人的命运。他更是在周易的基础上加入了自己的观点。通过卦象得出的是一个确定值，而还有另外一个方面也决定了人的命运，那就是后天的改变。如果一个人他一直都没有改变，那么他的命运就基本上和周易中说的差不多；而如果他一直在改变，那么卦象所决定的命运所占的比重就很小很小了。这是很有哲理的，所以我们需要不断学习，不断地改变自己，来最大化自己的命运。同时他还分享了他做研究的方法，面对一个问题，首先进行周密的思考，当把所有的问题都弄清楚之后，这件事差不多已经做了一半了。而我们处理问题，大多都是想个大概，然后就开始动手做，在做的过程中突然会遇到各种各样的问题，并不能像熊教授一样，主要是因为我们的认知还没有上升到一定的高度吧。

最后，非常感谢实验室能给我们这次学习的机会，经过这三天的学习，我认识到需要学习的东西还是有很多很多的。他们研究的问题很有新意，很有应用价值。现在我们已经知道了大的方向，他们研究的问题中，有很多的东西是和我们现在处理的问题差不多的，所以他们的一些方法是值得我们仔细的学习的。我觉得这些东西应该到用的时候再拿过来细读效果还是比较好的。