上周技术关注:Alexa开放搜索爬虫接口

  • [搜索技术; web2.0; Alexa] Alexa开放搜索爬虫 用户可以自建搜索引擎 #
    搜索引擎观察家John Battelle说,每个人可以使用网络爬虫,但是收集、维护一个大级别的信息库却是非常困难和昂贵的。如果alexa真做这个事,真是个震撼的事情,将冲击这个搜索领域,无疑,这提供了巨大的便利。它将在google的世界之外,建立一个搜索引擎的新生物链,这个事情可能将极大削弱Google在搜索领域的主导地位。
  • [搜索技术; Google; FeedBurner; amazon; ALEXA] 网络记事:05年12月14日 #
    Google推出Ig的APIsFeedFlare先让Feed互动起来Amazon开放Alexawebsearch APIs
    John Battelle报道了Alexa开发搜索平台的新闻,并说:“亚马逊将自己的索引库拿出来,将其作为一种网络服务,每个用户都可根据自己的核心需要打造属于自己的搜索引擎。” 该为平台为用户提供搜索、索引、分类等工具,并且开放了50亿网页-大约100GB的巨量数据,用户可以利用自己的创意和想法去任意实现想要的搜索引擎,免费用户会有广告by Google ads,他们列举了自己用这个平台实现的一个数码照片搜索作为示例,与之前A9的open search不同的是,前者是在实现数据抓取的开放,后者则在实现数据检索应用的开放,对于无法投入到大型数据的抓取分析和存储的用户来说,利用这一平台很简便也很节约成本(商业应用好像要收取部分费用)。
  • [.NET开发] Asp.Net Forums与现有系统整合方案示例 #
    在尽量少动已有代码的情况下找一种简单的方式来完成整合。之前看了宝玉的CnForums和已有系统的整合方案,最后偷懒决定在已有系统上述动作结束后将用户相关信息和操作类型附加在url后面传给一个新建页来处理在ANF中执行相关操作。
  • [网络技术] 一份5000万独立用户的网站数据分析 #
    一份刚刚整理的五千万独立用户的网站数据分析,去掉低于 1% 的数据,涵盖浏览器、操作系统、屏幕分辨率、屏幕颜色等比例信息,很值得站长或网站从业人员参考!
  • [搜索技术; Ruby; Rails] 冷观ruby on rails #
    Ruby on rails在哪些方面会带来生产效率的突变?我想无外乎以下几方面:一、ruby语言本身比java有了很大的简化;二、用reflection和默认的文件夹名等消灭了配置文件;三、用Active Record、MVC和代码生成等功能使开发CRUD的程序异常简单。但是仔细想想这些观点似乎不一定能站得住脚。
  • [算法] Dictionary of Algorithms and Data Structures #
    This is a dictionary of algorithms, algorithmic techniques, data structures, archetypical problems, and related definitions. Algorithms include common functions, such as Ackermann's function. Problems include traveling salesman and Byzantine generals. Some entries have links to implementations and more information. Index pages list entries by area and by type. The two-level index has a total download 1/20 as big as this page.
  • [BBS; 流氓软件; chinabbs; 3721] 流氓软件(插件)者永难翻身 #
    发展到现在,已经成了某些网站推广其广告或增加流量的手段。chinabbs最近就在广泛利用这一手段,中招用户在打开浏览器的时候,无论你打开的是什么网页,chinabbs的页面会弹出来。很多人看好chinabbs,他们自己也把自己当作web2.0的先进代表,然而,使用“流氓”手段这件事情,让chinabbs得到了更多的鄙视。3721已经被收购很久,周也离开了很久,但是“流氓”插件的恶名永远不会散去。chinabbs这种饮鸩止渴的做法,也将必定把他自己钉在互联网历史的耻辱柱上。即便将来上市了、有钱了,也会被人说,就是那个耍流氓发了财的泼皮。就如同生活中某些发了财的人永远会被人指指点点一样。
  • [互联网] 新浪科技:中国互联网十年白皮书 #
    从媒体出身加入创业军团的李学凌说,他从来不相信互联网产业中有什么现成的商业模式。因此,即便现在看不清未来,但如果有坚持5年不盈利的信念和资金实力,没有理由不成功。自称外行的著名导演张纪中在9月的西湖论剑上半开玩笑地说,互联网就是一个大泡沫,老是吹但却吹不破。也许每个人都对互联网可以说出自己的理解,因为历史就在今天发生,因为值得回顾的时间并不长,虽然故事足够多,多得让短短数万字很难完全承载……

更多技术动态,请访问我的365KeyRSS),你可以通过365Key订阅

阅读更多
想对作者说点什么?

博主推荐

换一批

没有更多推荐了,返回首页