我要去桂林---田春峰的网志

快乐比成功更重要

田春峰ID:accesine960
[修改头像]
705510次访问,排名39好友15人,关注者71
请用一段话来描述您自己,如性格、爱好、生活态度、工作情况、受教育状况等。让大家更了解你,不要超过1000个汉字
accesine960的文章
原创 243 篇
翻译 10 篇
转载 33 篇
评论 530 篇
田春峰的公告

天天多么乐

田春峰

accesine's Rapleaf Score

关于我的信息链接

Donews Blog

Subscribe with Bloglines

my qq number
最近评论
Hadoop Master:"""Ok ,现在Hbase为未来的DBA也带来了这个激动人心的特性,你只需要告诉你的数据存储到Hbase的那个column families 就可以了,不需要指定它的具体类型:char,varchar,int,tinyint,text等等"""

可定数据类型是数据库的高级特性, Hbase 无法支持这个“特性”就激动人心, 这很新鲜?这也叫特性?! 还是传统数据库系统……
zwl:好!
不见得:很有用 , 呵呵 , 这些站以后挨个拜访 :)
蛙蛙:蛙蛙推荐:蛙蛙牌正文提取算法
摘要:
上次和大家讨论了一些正文提取的细节问题,这次我把一些关键问题解决了,给大家上一下代码,并做了演示,能提取不少网站的正文了,当然在功能和代码组织上还有不少改进的地方。
http://www.cnblogs.com/onlytiancai/archive/2008/04/12/getmaincontent.html
蓝奇高级验证码识别引擎QQ:631753663:出售蓝奇高级验证码识别引擎,可准确识别新浪动网淘宝CSDN等多种复杂验证码。

输出为一个标准DLL,可供VB,VC,Delphi,C#.NET,VB.NET,模拟精灵,按键精灵等多平台调用,调用方法简单,几行代码即可完成。独具特色的边缘检测字符分离、旋转倾斜纠正和通用字符匹配算法(无论字体和大小), 使得该引擎对于像新浪、动网、淘宝、CSDN等多种验证码均有不错的识别率……
软件项目交易
订阅我的博客
XML聚合  FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
订阅到BlogLines
订阅到Yahoo
订阅到GouGou
订阅到飞鸽
订阅到Rojo
订阅到newsgator
订阅到netvibes
文章分类
收藏
相册
Computer Pic
domolo
life
lucene
MsnRobot DingDang
searchengine
search-engine
seo
个人信息
其他
.net
C++
os
sp
工作流
开发工具
名人连接
数据库相关
搜索引擎
网络开发
我的好朋友
移动开发
组件
存档
2008年04月27日

原创 Hadoop Hbase适合存储哪类数据?

Hadoop Hbase适合存储哪类数据? 最适合使用Hbase存储的数据是非常稀疏的数据(结构化或者半结构化的数据)。Hbase之所以擅长存储这类数据,是因为Hbase是column-oriented列导向的存储机制,而我们熟知的RDBMS都是row- oriented行导向的存储机制(郁闷的是我看过N本关于关系数据库的介绍从来没有提到过row- oriented行导向存储这个概念)。在列导向的存储机制下对于Null值得存储是不占用任何空间的。比如,如果某个表 UserTable有10列,但在存储时只有一列有数据,那么其他空值的9列是不占用存储空间的(普通的数据库MySql是如何占用存储空间的呢?)。阅读全文>

发表于 @ 2008年04月27日 22:37:00|评论(loading...)|编辑

2008年03月22日

原创 不选择使用Lucene的6大原因

任何一个软件,包括所有伟大的软件都有这样或者那样的“缺点”和各自适用的领域,Lucene也不例外。在国内对Lucene这个软件包的批评,似乎没有看到过。可能大家都忙于做项目,纵然Lucene有再大的缺陷,凭借着Lucene良好的口碑,也不会说上一句不是。阅读全文>

发表于 @ 2008年03月22日 23:05:00|评论(loading...)|编辑

2008年03月16日

原创 FriendFeed上的中国人

在玩了半个月后,我有些厌倦了。这半个月的成果是:1、Subscriptions 952、You are subscribed to 107 people 。够了。并且发现我这个玩法,可以机械化,于是,就有了这个:FriendFeed 上的中国人http://www.domolo.com/friend_feed_china阅读全文>

发表于 @ 2008年03月16日 01:08:00|评论(loading...)|编辑

原创 COM本质论 COMCHAT 源代码下载

COM本质论是本好书,Don Box 把什么是COM很清楚的写了出来。 这真是本好书,我是说:这本书的纸张质量也不错,我手头的这本COM本质论半截掉到洗衣盆里泡了半个上午后,晾干了还竟然能看,阿弥陀佛.... 阅读全文>

发表于 @ 2008年03月16日 00:57:00|评论(loading...)|编辑

2008年02月19日

原创 为什么2007年的图灵奖选择了模型检测技术

那模型检测技术是不是离程序员也很遥远呢?图灵奖作为计算机界诺贝尔奖,如果把奖项颁给一个离程序员很遥远的技术,还真说不过去。阅读全文>

发表于 @ 2008年02月19日 23:54:00|评论(loading...)|编辑

2008年02月17日

原创 机器智能将会在2029年达到人类的水平

作者的观点是:智慧与智慧载体的组成成分无关,而是与这些载体的组成方式有关。还好刚写到这句,我找到这篇文章,大家可以在这里查看:上帝死了?——人工智能的复杂性会最终超越人脑么?阅读全文>

发表于 @ 2008年02月17日 23:25:00|评论(loading...)|编辑

2007年10月26日

原创 seo优化:把百度放进数据库

seo优化:把百度放进数据库 有时候我想,能把百度的数据放进数据库,用广大程序员熟悉的sql语句查询百度的搜索结果应该是一个不错的主意。在这方面Google早已经跨出了一大步,利用Google Search API 把Google的搜索结果放进数据库是很容易办到得。当然,Google Search API 有相应的限制,防止被人恶意使用。而百度则忙着在贴吧,新闻和 C2C 上大占拳脚,这些努力除了让百度的股价一再飙升外,对程序员来说一个 BaiDu Search API 仍然是遥不可及的事情。阅读全文>

发表于 @ 2007年10月26日 18:38:00|评论(loading...)|编辑

2007年10月14日

原创 SEO 比比看: Che168.com VS pcauto.com.cn

做SEO工作,平常少不了多观察各种网站优化的案例。俗话说的好,懂行的看门道,不懂的看热闹。面对五花八门的网站,如何才能从专家的角度,以最快的速度来了解被观察网站的优化方式呢?如何才能最快、比较全面的评判网站的优化效果呢?相信这是专业SEO面面临的共同的困难。 阅读全文>

发表于 @ 2007年10月14日 10:59:00|评论(loading...)|编辑

2007年09月14日

原创 下载 XmlLite ( 包括:xmlLite.h , xmlLite.lib , xmlLite.dll )

XmlLite 是微软在在Vista中介绍的一个轻量级的XML解析引擎,非常好用。XmlLite 是可以运行在 XP/2000和 2003 系统下的,只需要有下面这3个下载 XmlLite ( 包括:xmlLite.h , xmlLite.lib , xmlLite.dll ) 阅读全文>

发表于 @ 2007年09月14日 07:53:00|评论(loading...)|编辑

2007年08月25日

原创 《百度互联网论坛收录开放协议》-生成器

最近百度也在这方面有所动作,在推出百度新闻提交协议后,又推出了:《百度互联网论坛收录开放协议》。刚才忙活了半天,终于实现了这个功能:百度论坛收录开放协议生成工具。下载点击这里:http://www.domolo.com/seo_software阅读全文>

发表于 @ 2007年08月25日 00:13:00|评论(loading...)|编辑

Csdn Blog version 3.1a
Copyright © 田春峰