自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(41)
  • 收藏
  • 关注

翻译 构建基于通用导航器架构(CNF)的视图 第一部分:定义ViewPart

由windy444翻译,转载请注明原文名:Building a Common Navigator Framework (CNF) Viewer Part I: Defining the View Part ,作者:MICHAEL ELDER,出处:http://scribbledideas.blogspot.com/(本人从未能打开过,呵呵)。先上CopyrightThe opinio

2007-12-30 20:40:00 1771

原创 Item-based协同过滤

论文:Item-Based Top-N Recommendation Algorithms过程:1. 构建一个m*m的矩阵,每一列最多有k个非0值,比如第j列,非0值代表和第j个item最相关的k个item。k一般10-20,不会很大,保持矩阵的稀疏性。2. 推荐的方式如此:构建m*1的矩阵,表示当前用户购买过的item,1表示购买,0表示未购买。以此为输入,3. 上述矩阵相乘

2011-12-29 13:49:42 1267

原创 基于用户的协同过滤

步骤:1. 找出与当前用户最相似的k个用户2. 计算出所有被这k个用户购买的商品,并且为每个商品赋一个权重3. 根据权重排序,并且过滤当前用户已经买过的商品关键在于如何找出最相似的用户,以及如何给商品权重。相似用户可以用余弦夹角计算距离。商品权重可以看以往的购买历史之类的。缺点:1. 计算复杂度高2. 实时要求达不到

2011-12-06 13:53:33 559

原创 朴素贝叶斯分类

http://www.cnblogs.com/phinecos/archive/2008/10/21/1315948.html

2011-08-10 09:32:34 519

原创 电子商务网站的分词与索引

简单调研了下,京东,淘宝,拍拍都是单字索引,当当,卓越等都是基于分词的索引。使用什么粒度的索引没有对错,只是各种因素权衡后的一个结果。单字索引的缺点在于,索引量会大很多,性能也会下降,对于相关性排序的要求也高,会召回大量不相关的商品。优点就是召回率,能够召回的商品都不会遗

2011-08-08 14:28:05 1497

原创 Eclipse3.3的一个bug

小bug,影响不大。选择Import->File System ,出现的Wizard中,勾选Create complete folder structure.再选择导入文件夹。这时候,文件是能导入到正确位置的,但错误之处在于判断是否会覆盖原有文件上。按这样的方式,两次导入同一个文件夹,它不会提示覆盖。如果导入的文件夹(为了达到效果,这个文件夹要放在某个根目录下,比如c盘)下面有个文

2008-03-08 17:15:00 551

原创 好久以前developerworks上发表的文章:使用 EMMA 测量测试覆盖率

www-128.ibm.com/developerworks/cn/java/j-lo-emma/index.html

2008-01-01 15:32:00 530

转载 google笔试题(zz)

1,求两个二进制数的异或值,基本上学过一点计算机的东西的人都能对的题目。。2,不记得了。。也是不需要思考的题目。。3,大概是如下的函数:int someFunc(int x){    if (x == 0)        return 0;    else        return x + someFunc(x - 1);}问这个计算的是什么。。。4,不记得了。。不需要思考吧。。5,不记得了

2008-01-01 15:02:00 1592

原创 我的本科毕业设计(非水文,设计了一个新算法):一种字符编码猜测工具的实现方法

摘要自从进入计算机时代后,人们创造了许多编码,来表示各国的语言文字。这些编码从一开始设计时,就没有考虑到要和其它编码兼容,它们只是为某个国家或某种语言来服务的。随着Internet的发展,各国间的联系更加紧密,出现在人们视野中的不再是单纯某个国家的文字,越来越多其他国家的文字出现在了本地的计算机上。再加上由于历史原因,即使是一个国家的文字,都可能会以多种编码形式出现。虽然,一种统一的编

2008-01-01 14:56:00 4347 1

原创 夜走天涯的Intel笔试和面试

笔试的一题编程题:       字符串中“*”能代表一串字符,“?”能代表一个字符,然后给出两个含有前两个字符的字符串是否匹配。      变态的面试题:gcc是怎么实现的。 顺便说一下八爪鱼的Intel的面试题:      1 一个很大的数组中,放有一系列有正有负的数,如何找出和最大的那个区间。         思想:动态规划。      2 删除string中的某种

2008-01-01 14:36:00 647

原创 微软一笔试题的讨论

上次去听思科宣讲时,讨论了一个微软笔试题,现整理一下。题目:一个单向链表中有一个环,如何定位这个环。思考:1 这个环肯定在链表末尾           2 一个效率不高的解决方法:从表头开始,读入一个就压入栈,然后拿栈顶元素和已经压入栈的每个元素比较(指针的比较),若出现相等,说明刚入栈的元素是环的开始。此方法的复杂度为O(n2)。          3 猪头的高见:从如何判断一个

2008-01-01 14:35:00 611

转载 Java 面试中的陷阱【zz】

  第一,谈谈final, finally, finalize的区别。 final?修饰符(关键字)如果一个类被声明为final,意味着它不能再派生出新的子类,不能作为父类被继承。因此一个类不能既被声明为 abstract的,又被声明为final的。将变量或方法声明为final,可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值,而在以后的引用中只能读取,不可修改。被声明为

2008-01-01 14:33:00 556

原创 堆栈设计

 设计一个堆栈结构,能够增加一个元素,删除最后增加的一个元素,得到最小的那个元素,并且这些操作的时间复杂度是0(1),空间复杂度为0(n) 解决思路:设计一个辅助栈

2008-01-01 14:28:00 733

原创 SCA:Java Component Implementation Specification

服务:service 可以从WSDL产出,并且是remotable的被Java类(非接口)定义的服务是非远程的。在Java类HelloServiceImpl前标注 @Service(HelloService.class) 表明该类把接口HelloService作为服务。类HelloServiceImpl 可以在前面标注 @Service(HelloServiceImpl.class

2008-01-01 14:26:00 508

原创 SCA :Assembly Model Specification 摘记

1 Assembly Model1.1 IntroductionA model for the assembly of servicesA model for applying infrastructure capabilities to services and to service interactions, including Security and Transactions

2008-01-01 14:25:00 747

转载 关于傅利叶变换的一些数学解释兼及其它(zz from 水源)

向前进, 你就会产生信念.                                        ——达—朗贝尔傅利叶变换是信号系统的奠基石,小波分析的基础理论,理论的粗疏理解固然不难但是要达到深刻的境界,是不能仅仅依靠教科书的由于本次讨论持续时间较长,参与面较广,合集再给予m之后效果反而不佳为避免讨论湮没,因此在此简略加以总结,鄙下仅仅负责发帖,所有版权全部归于以下几位学长:Valeti

2008-01-01 14:24:00 1537

原创 读“有效的时间管理”

 原书名:Aligned Thinking : Make Every Moment Count 作者:Jim其实,更准确的翻译应该是:有序思考下面这些,大概是我从书中学到的:1.明白自己的人生目标,你希望自己的生活怎样,比如,有丰厚的收入,美满的家庭,还有健康,你希望别人对你的评价如何,如,乐于助人,有学识,有魅力。所有这些,你可以排个序,越前面的越重要。然后,可以每个季度,刷新一

2008-01-01 14:22:00 551

原创 Paper摘记:Bagging and Boosting for the Nearest Mean Classifier:

全名:Bagging and Boosting for the Nearest Mean Classifier:Effects of Sample Size on Diversity and Accuracy作者:Marina Skurichina, Liudmila I. Kuncheva and Robert P.W. Duin摘记:理论上,组合独立的分类器,会得到比单一分类器更好

2008-01-01 14:20:00 1166

原创 Paper摘记:Multiple-Prototype Classifier Design

作者:James C. Bezdek, Fellow, IEEE, Thomas R. Reichherzer, Gek Sok Lim, and Yianni Attikiouzel, Fellow, IEEE出处:IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART C: APPLICATIONS AND REVIEWS, VOL.

2008-01-01 14:18:00 740

转载 dodo:人脸识别方法个人见解zz

此帖转自http://prfans.com/forum/index.php看到j.liu关于人脸识别的帖子,萌发写这个帖子的念头。没有别的意思,就是想抛砖引玉,把问题说的全面一点,希望j.liu和回其帖子的兄弟姐妹们不要介意。如有兴趣,欢迎继续讨论。在以下讨论中,TPAMI = IEEE Transactions on PAMI 这个杂志PAMI  是指 pattern analysis an

2008-01-01 14:16:00 1243

原创 书评-Machine Learning(机器学习)

就凭作者Tom M. Mitchell是AAAI主席这一点,就能让人相信,这是本值得一读的书。    本人读的是中文翻译版,曾华军等译。本人的感觉是读上去相当通顺,没有需要对照原文才能读懂的东西,而且术语翻译的也很到位,可以说翻译的相当好。说实话,国内翻译的书籍,质量参差不齐,有的读上去甚至有机器翻译之嫌疑,反而是英文原文更好理解。一个学长也有接过导师分配的翻译书籍的活,翻过之后,他对我说,能

2008-01-01 14:15:00 936 1

原创 Paper摘记-Large Margin Nearest Neighbor Classifiers

作者:Carlotta Domeniconi, Dimitrios Gunopulos, and Jing Peng, Member, IEEE出处:IEEE TRANSACTIONS ON NEURAL NETWORKS, VOL. 16, NO. 4, JULY 2005在Nearest Neighbor中,当维数比较高时,会存在偏见(这种偏见的存在,是因为我们对每一个维都同等对待)。

2008-01-01 14:13:00 1240

原创 Huaiqing Wang的讲座:How to write and publish quality research papers

 Huaiqing Wang香港城市大学的教授,交大校友。讲座感受:1.研究要找个小的领域,不要范围过大。(论文的题目也如此)2.多读优秀Paper,可以就人家不足的地方做改进。即使比人家提高了1%的性能,也是可取的。3.开发也能写出优秀的论文。总结开发中遇到的问题,提出新的解决方案。4.顶级杂志需要有理论证明。他让他的学生在一篇文章中提了两个定理,然后论证了一下,虽然看上

2008-01-01 14:10:00 956

原创 我来介绍一下"反向传播学习算法"和"梯度下降法"

梯度下降法,就是利用负梯度方向来决定每次迭代的新的搜索方向,使得每次迭代能使待优化的目标函数逐步减小。梯度下降法是2范数下的最速下降法。     最速下降法的一种简单形式是:x(k+1)=x(k)-a*g(k),其中a称为学习速率,可以是 较小的常数。g(k)是x(k)的梯度。     直观的说,就是在一个有中心的等值线中,从初始值开始,每次沿着垂直等值线方 向移动一个小的距离,最终收敛在中心

2008-01-01 14:08:00 7578 3

原创 Statistical Pattern Recognition-A Review (1999)读后感

很好的一篇综述型文章,作者Anil K. Jain等目录结构1 介绍1.1 何为模式识别1.2 模板匹配1.3 统计方法1.4 语义方法1.5 神经网络2 统计模式识别数字识别的可用特征集(30*48的图像):1)76个字符形状的Fourier系数 2)216个轮廓关系 3)64个KL系数 4)240个2*3窗口象素平均值 5)47 Zernike moment

2008-01-01 14:06:00 1381

原创 Exploring the Power of Links in Data Mining-韩家炜演讲摘录

 韩家炜(Jiawei Han),数据挖掘的泰斗级人物,大名如雷贯耳,今日有幸能一睹真人风采。见面第一感觉居然是此人年轻时肯定是个帅哥(汗!),当然,现在仍然是个精神矍铄的智者。   演讲的主题是:Exploring the Power of Links in Data Mining。报告主要讲了四篇论文,都是他的博士研究生Xiaoxin Yin完成。这些工作,大多是受到PageRank算法H

2008-01-01 14:04:00 1357 1

原创 元组表模式(J2EE design pattern摘记及感想7)

元组表模式:序列化实体模式的缺点是:二进制代码难以理解,当格式发生变化时很难该变。若就用一行元组来表示完整的数据(对象)(即普通的数据库表示方式),当我们对数据格式的要求有变化时,比如添加一个属性列,我们就不能用原来的表了,必须重建表。元组表模式把一个数据对象拆分成多个表,每个表有key,fieldname,属性1的值,属性2的值。。。,一个表中,只有一个属性的值非NULL,其它都为NUL

2008-01-01 13:59:00 521

原创 主键批处理器模式及序列化实体模式(J2EE design pattern摘记及感想6)

主键批生成器模式:从数据库序列中获取一个值(基数)来生成一批唯一的数字ID。这个基数在每次获取时,都是不同的。获取基数方法:在Oracle中:Statement.executeQuery("SELECT SEQ_PK.NEXTVAL FROM DUAL")假设我们的一批的大小为10,第一次得到基数为1,则第一批的ID是从1*10到1*10+10-1即10到19.下次得ID,当还未超过1

2008-01-01 13:57:00 485

原创 DTO DAO & PAO(J2EE design pattern摘记及感想5)

DTO:数据传递对象:与其通过多次调用来获取一组相关数据,不如用一次调用获取一个包含了我们在当前事务中所需要的所有东西的定制对象。串串烧:PatientBean即我们定制的对象。这个对象提供了一组的get和set方法,来操作数据项。我们只要得到了这个对象,则可以操作所有当前事务中要操作的数据项了。如何得到该对象?ejbLoad方法首先从EntityContext中找到要找对象的

2008-01-01 13:56:00 4138

原创 资源池模式(J2EE design pattern摘记及感想4)

 串串烧一个XMLClient首先用XMLParseFactory作为参数,创建了一个ResourcePool,并设置了最大资源数为2.然后,第一个线程来请求解析器,调用了getResource方法。此时,还没有一个resource,需要通过factory方法创建一个。假设第二个线程又申请了一个resource,当然,因为线程池只有一个借出未归还的resource,所以它自己又创建了一个。

2008-01-01 13:55:00 868

原创 缓存过滤器(J2EE design pattern摘记及感想3)

这是个Decorator模式。我们要做的是,得到response后,缓存下来,下次一个request来后,先检查缓存中有没有相应的response可用。要用到Filter,及HttpServletResponseWrapper。doFilter(request,response)是关键方法,它让我们能级联调用下去,直到无Filter时,就调用doGet,doPost。request在被塞入前可被包

2008-01-01 13:53:00 678

原创 异步页面模式(J2EE design pattern摘记及感想2)

 适用于不是经常更新,且对于一致性要求不是太严格的。我们把远端的页面缓存在本地,然后设置一个过期时间,到了之后就自动更新它。这个更新用到的是Daemon进程。串串烧:碰到RSSChannel自定义标签,调用RSSChannelTag构造函数,其取得了RSSSubscriber的一个实例(Singleton模式)。RSSSubscriber初次创建时,创造存储RSSInfo的缓存,以及一个用

2008-01-01 13:51:00 523

原创 实现复合视图(J2EE design pattern摘记及感想1)

首先列出几个部件(相关代码见原文)MainTemplate.jsp 有两个自定义标签,一个定义容器的container,另一个定义容器中的元素include此文件为显示页面设置了一个框架(模板),通过自定义标签,可以动态加入内容。View.xml       对于每个页面,都有view元素,此中指定所用的模板,还可以包括一个或多个的container元素。这些container标签中,指定了inc

2008-01-01 13:49:00 719

原创 好书推荐:J2EE design pattern

 本人之前,大概只了解J2EE中的一些概念,没写过J2EE方面的程序,也基本上没看过J2EE的代码。我一向相信,要掌握一个东西,最好的方法,就是从大局上来把握它,如果你一开始就陷入到芝麻粒大小的事情中去的话,那么,你学习的动力很快就会没有了,而且,那些东西,过个十天半月,估计你也忘差不多了。从大局观开始,你可以慢慢填充你的框架,你能够很清楚,现在这个框架内最缺少的是什么东西,也就不会浪费你的精力了

2008-01-01 13:42:00 950

原创 [读书笔记]INTRODUCING SCA摘记

 作者:DAVID CHAPPELLSCA FUNDAMENTALSCOMPONENTS AND COMPOSITES(由component组成)There must be a way to define components and to describe how they interact.an SCA application can be accessed by soft

2008-01-01 13:35:00 467

原创 CSDN博客的bug多多 & 丢失文章招领启事

 刚才翻译了3个小时的一篇文章,保存后,再打开,居然变成了其他人的文章了。惊出一身冷汗,所幸页面有缓存,重敲了最后一段话,算是挽救了我3小时的努力。以后得作保存了。下面一段文章就是莫名冒出来的,谁丢了的来领啊。大餐我也把它分为五代:第一代,跑灯倒转后,滚轮可以掉下3个相同的图案,比如掉下三个芒果,你只要押了芒果这一门,就会得分。第二代,跑灯倒转后,比如跑灯跑到芒果上,滚轮开始转动,掉下1个

2007-12-31 20:00:00 668

翻译 构建基于通用导航器架构(CNF)的视图 第五部分:操作提供者

由windy444翻译,转载请注明原文名:Building a Common Navigator Framework (CNF) Viewer Part V: Action Providers,作者:MICHAEL ELDER,出处:http://scribbledideas.blogspot.com/(本人从未能打开过,呵呵)。先上CopyrightThe opinions and

2007-12-31 14:35:00 693

翻译 构建基于通用导航器架构(CNF)的视图 第四部分:基于对象的操作(Object Contributions)

 由windy444翻译,转载请注明原文名:Building a Common Navigator Framework (CNF) Viewer Part IV: Object Contributions,作者:MICHAEL ELDER,出处:http://scribbledideas.blogspot.com/(本人从未能打开过,呵呵)。先上CopyrightThe opinion

2007-12-31 14:31:00 1009 1

翻译 构建基于通用导航器架构(CNF)的视图 第三部分:配置菜单

 由windy444翻译,转载请注明原文名:Building a Common Navigator Framework (CNF) Viewer Part III: Configuring Menus,作者:MICHAEL ELDER,出处:http://scribbledideas.blogspot.com/(本人从未能打开过,呵呵)。先上CopyrightThe opinions

2007-12-31 14:24:00 1279

翻译 构建基于通用导航器架构(CNF)的视图 第二部分:增加内容

由windy444翻译,转载请注明原文名:Building a Common Navigator Framework (CNF) Viewer Part II: Adding Content,作者:MICHAEL ELDER,出处:http://scribbledideas.blogspot.com/(本人从未能打开过,呵呵)。先上CopyrightThe opinions and i

2007-12-31 14:20:00 1367

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除