- 博客(5)
- 资源 (10)
- 收藏
- 关注
原创 【GraphLite】同步图运算初试-数三角形
0x00 前言图很适合进行分布式并行计算,比如最短路径,PageRank等问题,比较著名的图计算框架有Prege,cmu的GraphLab,apache的Giraph等。GraphLite属于BSP模型。 GrpahLite:https://github.com/schencoding/GraphLite该篇同上篇仅属于备忘式的记录,当前分布式同步图等也具有更为轻量级便捷的写法。0x01 问题描述
2017-05-14 16:18:29 1664 2
原创 【MapReduce Java】简单的平均距离计算
要求没什么太多要说的,以前的MapR in Python用熟练了,Java要不是作业感觉也不会太常用它了…… 就贴一下以备忘(防止以后突然要用java写的时候可以来参考一下)输入文件:文本文件 每行格式 source _ destination _ time3个部分由空格隔开其中source和destination为两个字符串,内部没有空格time为一个浮点数,代表时间(秒为单位)涵义
2017-05-14 15:03:01 1027
原创 【Hadoop & Hbase】大数据存储系统编程_读出写入
0x01 编译环境jdk 1.7hbase 0.98hadoop 2.6Ubuntu Linux 14.04.20x02 目标其中我的任务编号为5,即Sort-based Distinct Sort-based Distinct 根据group by key 排序 然后同一个group的都会在一起 统计输出
2017-05-14 14:48:16 1865
原创 【editdistance】在Windows环境下配置python库editdistance
编辑距离是文本处理中很常见的一种判别相似度的方法, Wikipedia In computer science, edit distance is a way of quantifying how dissimilar two strings (e.g., words) are to one another by counting the minimum number of operati
2017-05-05 14:20:21 6856 10
原创 【TensorFlow】Windows10下配置TensorFlow环境
用TeamViewer中转+VNC连接来图形化, SecureCRT两重ssh跳转来改代码, 以及paste.ubuntu.com来复制粘贴, 这样的日子我已经受够了…… 我要在我的windows上配一个!
2017-05-04 14:01:35 14823 2
【PSP录制工具】RemoteJoy_Lite_019_CHT
2018-03-25
From Online Behaviors to Offline Retailing
2016-07-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人