- 博客(13)
- 资源 (4)
- 收藏
- 关注
原创 Exploring the Hidden Dimension in Graph Processing论文注释(待续。。)
图片就不贴了,OSDI16一篇文章,讲的是对于MLDL问题图中任务的划分的一种优化。大意就是将向量分为不同的部分并行的进行计算,其主要思想是将机器节点分为L组,每组均持有图的完整结构,组内根据2D划分(边分割)分布图(边负载平衡),每组当中的vertex保有1/L的向量,那么每台机器可以存更多vertex,从而组内的replicas数量减少,相对应的消息代价减少(增加了组间通信代价)。这个方法对诸如SGD、ALS都有良好的效果。
2017-03-24 21:43:34 930 3
转载 node2vec的一些思考
概述论文主要观点本文将抽取网络中节点的特征转化成最优化一个“可能性”目标函数问题,这个“可能性”是该节点可以保存其邻居节点的信息。成果node2vec,如上述,利用SGD优化,高效“随机选择邻居”算法,可让node2vec可适应不同的网络方法模型定义可能性,并且给予两个条件,构成要优化的目标函数; 条件独立性: 节点之间对称性
2017-03-20 21:54:39 7633
原创 word2vec总结
前几天实验室师姐问我之前有没有看过word2vec,这才想到去年暑假看过的word2vec,进来学习努力程度不是很够,虽然戒了游戏,但是显然有一个不愿学习的舍友对没有自控力的自己影响有多大,废话不多说了,抓紧总结word2vec首先什么是word2vec?word2vec 是 Google 在 2013 年中开源的一款将词表征为实数值向量高效工具word2vec 通过训练,可以
2017-03-20 20:49:51 949
转载 Hadoop数据操作系统中YARN全解析
“ Hadoop 2.0引入YARN,大大提高了集群的资源利用率并降低了集群管理成本。其在异构集群中是怎样应用的?Hulu又有哪些成功实践可以分享? 为了能够对集群中的资源进行统一管理和调度,Hadoop 2.0引入了数据操作系统YARN。YARN的引入,大大提高了集群的资源利用率,并降低了集群管理成本。首先,YARN允许多个应用程序运行在一个集群中,并将资源按需分配给它们,这大大提高了资源
2017-03-20 15:53:24 626
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人