自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

never1987的专栏

个人工作总结和一些新技术的探讨

  • 博客(5)
  • 收藏
  • 关注

原创 数据挖掘-公司别名聚合(五)

前面说的关系链是

2014-10-10 22:36:39 932

原创 数据挖掘-公司别名聚合(四)

接下来开始

2014-10-09 22:09:41 1063

原创 数据挖掘-公司别名聚合(三)

确定了从名称本身出发不靠谱,需要引入其他特征值,但是引入什么好呢?前面说过了,我的公司名称来源是用户手动填写的,并且用户量巨大,所以最先被引入的变量就是人。设想两个人,一个所填公司是“华为公司”,另一个是“华为科技有限公司”,我们不知道这两个是不是一个公司,但是如果我们知道了这两个人工作时间的ip在一个ip段,且工作时间地理位置重合,且社交网络中得好友关系重合度高,我们是不是可以高度怀疑这

2014-09-29 11:26:51 1204

原创 数据挖掘-公司别名聚合(二)

接下来一段时间依然没有放弃从文本本身出发,阅读了大量字符串

2014-09-28 20:14:44 1426

原创 数据挖掘-公司别名聚合(一)

工作3年终于开始写点东西了,既然是第一篇就写点自己yin

2014-09-28 19:31:36 2085

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除