GeekStuff
码龄14年
关注
提问 私信
  • 博客:782,064
    社区:339
    782,403
    总访问量
  • 142
    原创
  • 暂无
    排名
  • 292
    粉丝
  • 0
    铁粉

个人简介:I will be posting instruction guides, how-tos, troubleshooting tips.

IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:上海市
  • 加入CSDN时间: 2011-09-11
博客简介:

I am not a quitter.

博客描述:
Storage, Big Data, Database, Big Graph Computation
查看详细资料
个人成就
  • 获得283次点赞
  • 内容获得100次评论
  • 获得913次收藏
  • 博客总排名1,760,956名
创作历程
  • 2篇
    2017年
  • 11篇
    2016年
  • 37篇
    2015年
  • 57篇
    2014年
  • 37篇
    2013年
  • 2篇
    2012年
成就勋章
TA的专栏
  • MLDM
    38篇
  • Spark
    5篇
  • Hadoop
    19篇
  • Java
    17篇
  • Scala
    9篇
  • Storage
    9篇
  • C/C++
    8篇
  • Database
    5篇
  • Algorithm
    40篇
  • Reflection
    4篇
  • Graph
    8篇
  • OS
    25篇
  • R
    8篇
  • Skill
    4篇
创作活动更多

新星杯·14天创作挑战营·第13期

这是一个以写作博客为目的的创作活动,旨在鼓励大学生博主们挖掘自己的创作潜能,展现自己的写作才华。如果你是一位热爱写作的、想要展现自己创作才华的小伙伴,那么,快来参加吧!我们一起发掘写作的魅力,书写出属于我们的故事。我们诚挚邀请你们参加为期14天的创作挑战赛!注: 1、参赛者可以进入活动群进行交流、互相鼓励与支持(开卷),虚竹哥会分享创作心得和涨粉心得,答疑及活动群请见:https://bbs.csdn.net/topics/619781944 【进活动群,得奖概率会更大,因为有辅导】 2、文章质量分查询:https://www.csdn.net/qc

92人参与 去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

分布式系统原理

发布资源 2014.02.20 ·
pdf

Linux-101-Hacks

发布资源 2014.02.20 ·
pdf

TAO: Facebook's Distributed Data Store for the Social Graph

发布资源 2014.05.29 ·
pdf

Facebook Message

发布资源 2014.05.29 ·
pdf

MapReduce 模糊聚类 K-Means 及其评估

发布资源 2014.06.17 ·
zip

三元闭包与强弱联系

美国斯坦福大学教授Granovetter的The strength of weak ties论文提出了弱联结理论, 该理论认为:弱联结比强连接更能穿越不同的社会群体,因此能触及更多的人,穿过更大的社会距离。Granovetter发现多数人是通过私人关系介绍找到现在工作的,值得注意的是,这里的私人关系往往只是熟人(acquaintances),而非亲密朋友(close friends)。问题:为什么是一般熟人(acquaintances),而非亲密朋友(close friends)?
原创
博文更新于 2015.05.28 ·
11312 阅读 ·
2 点赞 ·
0 评论 ·
17 收藏

HBase学习总结

HBase
原创
博文更新于 2016.11.21 ·
1932 阅读 ·
2 点赞 ·
0 评论 ·
1 收藏

NameNode和DataNode启动

NameNode的启动方式有:format、regular、upgrade、rollback、finalize、import六种,DataNode的启动方式有:regular、rollback两种。       NameNode regular启动时会先创建Server,Server是RPC服务器端的实现,它主要负责和远程的客户端进行通信,反序列化和序列化远程调用中的参数和返回值,然后再创
原创
博文更新于 2016.11.21 ·
1910 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

k-shingles与minhash技术

对于web网页去重的应用,如抄袭、镜像等,通过将网页表示为字符k-grams(或者k-shingles)的集合,把网页去重的问题转化为找到这些集合的交集。使用传统的方法存储这些巨大的集合以及计算它们之间的相似性显然是不够的,为此,对集合按某种方式进行压缩,利用压缩后的集合推断原来集合的相似性。 Jaccard相似性:只关注集合之间的交集大小。集合S和T的Jaccard相似性定义如下:
原创
博文更新于 2014.11.19 ·
10070 阅读 ·
5 点赞 ·
0 评论 ·
25 收藏

Hadoop中的RPC实现

在IPC包中,最重要的3个类是Server,Client和RPC,它们具有层次化的结构。1.RPC类是对Server、Client的具体化。在RPC类中规定,客户程序发出请求调用时,参数类型必须是Invocation;从服务器返回的值类型必须是ObjectWritable。2.RPC类是对Server、Client的包装,简化用户的使用。如果一个类需充当服务器,只需通过RPC类的静态方法g
原创
博文更新于 2016.11.21 ·
1334 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

ClouData-3rd

发布资源 2015.09.22 ·
pdf

spark 1.1.0

发布资源 2014.11.04 ·
tgz

hadoop-eclipse-plungin-1.2.1.jar

发布资源 2013.10.07 ·
jar

hadoop-eclipse-plugin-1.0.4

发布资源 2013.04.02 ·
jar

hadoop Eclipse插件

发布资源 2014.11.04 ·
jar

git常用命令

git命令拉取项目git clone git@XXXX向仓库中添加新文件working directory to staging area: git status; git add READMEor git add .staging area to git repository: git status; git commit -m "init repo"历史提交commit日志: 查看
原创
博文更新于 2018.10.11 ·
1221 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

JVM学习笔记

java XXX -> 装载配置(根据当前路径和系统路径查找jvm.cfg) -> 根据配置查找JVM.dll(JVM主要实现) -> 初始化JVM获得JNIEnv接口(包括findClass等操作) -> 找到main方法执行
原创
博文更新于 2018.05.30 ·
1260 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏

Spark MLlib矩阵分解源码分析

基础知识特征值分解如果一个向量 vv 是方阵 AA 的特征向量,可以表示成下面的形式: Av=λvAv = \lambda v 其中, λ\lambda 为特征向量 vv 对应的特征值,矩阵 AA 的特征向量是相互正交的。 特征值分解是将矩阵 AA 分解为如下形式: A=Q∑Q−1A=Q\sum Q^{-1} 其中,矩阵 QQ 是 AA 的特征向量组成的矩阵,∑\sum 是对角矩阵。奇异值
原创
博文更新于 2017.06.20 ·
3203 阅读 ·
1 点赞 ·
0 评论 ·
4 收藏

常用命令汇总

该博文为我之前文章重新设置文章格式,改为markdown格式,更加美观。中文乱码 编辑 `/etc/sysconfig/i18n,LANG=”zh_CN.UTF-8”查看环境变量 env查看当前用户的计划任务 crontab -l 查看挂接的分区状态 mount | column -t 查看所有分区
原创
博文更新于 2017.06.07 ·
1027 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

awk tricks

删除每行起始的空白 awk '{ sub(/^[ \t]+/, ""); print }'删除每行结尾的空白 awk '{ sub(/[ \t]+$/, ""); print }'删除每行收尾的空白 awk '{ gsub(/^[ \t]+|[ \t]+$/, ""); print }'删除空白行 awk 'NF' awk 'NF > 0' awk '!/^$/' awk '/.
原创
博文更新于 2017.05.14 ·
976 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏
加载更多