自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

数据挖掘爱好者

关注搜索、推荐相关算法

  • 博客(3)
  • 资源 (5)
  • 收藏
  • 关注

原创 fp growth 实现

近日,准备使用fp growth写个程序,挖掘频繁模式。但是从han jia wei哪里下载的c语言程序效率非常低。根本不能满足大数据量的要求。仔细分析源代码发现,fp growth需要生成很多棵树,每个结点路径都需要保存,还是非常消耗资源的。考虑之后,使用hadoop编写了一个简单的fp growth,总是耗尽java的内存。最后,限制了结点的数量,得到一个计算结果。

2009-03-21 10:39:00 1516 3

原创 相似性计算

public double CosSim(HashMap hashA,HashMap hashB,double sa,double sb) { double sum=0; HashMap tmp=null; if (hashA.size()>hashB.size()) { tmp=hashA; hashA=hashB;

2009-03-18 17:43:00 1442 2

原创 层次聚类与分类规则

 层次聚类,通过设计相似性函数(或者聚类函数),可以非常方便的实现无监督的聚类过程。但是相似性阈值太高,得到类目太多,达不到聚类的目的;阈值太低,类目少,但是准确性就会降低。在这个时候,使用一些分类规则,当相似度很高的时候,当满足一些规则,就降低其相似度,这样可以得到合适的类目个数,同时得到比较满意的准确率。

2009-03-05 14:30:00 1547 1

logview里面SourceXML页面,找到 <TaskPlan> </TaskPlan>里面的内容的json格式转换

1.打开Chrome左上角三个点按钮 -> 更多工具 -> 扩展程序 2.打开右上角的开发者模式,点击加载已解压缩的扩展程序,导入上述文件夹 3. 找到插件,将其锁定在工具栏 4.把logview 里面SourceXML页面,找到 <TaskPlan> </TaskPlan>里面的内容,copy到这个插件里面的左侧即可使用了。

2023-09-15

出价公式推导 1705.09416.pdf

Optimal Real-Time Bidding for Display Advertising

2021-05-28

数字ip转ip v4的工具

数字ip转ip v4的excel工具,数字ip转ip v4的excel工具

2018-02-02

RTL8188C_8192C_USB_linux_v4.0.2_9000.20130911

无线网卡驱动 rtl 8188 网卡

2017-05-20

速卖通标题优化技巧

速卖通标题优化各种功能: 标题诊断 热词分析 宝贝找词 标题优化 海量直通车关键词

2015-11-19

张乐博士的最大熵手册

张乐博士的最大熵手册 张乐博士的最大熵手册 张乐博士的最大熵手册

2011-04-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除