自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)

原创 关于go语言

<br /><br /> <br />腾讯soso 文/王益<br /> <br />    最近几个星期里,我的工余时间基本全部放在学习和使用Go语言上了。这只螃蟹很好吃;向大家推荐。<br />    对Go语言的总体感觉:<br />- Go语言的语法简单(语言的复杂程度小于C++和Java,关键词数量相当于C),<br />- Go程序的编译速度非常快。我尝试了两种Go编译器:<br />  1. Rob Pike的GC编译器编译起来瞬间完成;<br />  2. Ian Taylor的gccgo编

2011-03-30 14:46:00 38342 6

原创 情境搜索专题访谈

<br />腾讯soso—soso高层和高校专家畅谈情境搜索未来<br /> <br /><br />      参加本次访谈的主要嘉宾有:腾讯soso总经理孙良,腾讯soso副总李京,腾讯soso副总监杨海松,北京信息科学技术学院教授俞士汶,中科院计算所程学旗,访谈由csdn的总编刘江主持。<br /> <br />      本次访谈主要讨论了传统搜索引擎的现状,发展中遇到的瓶颈,对于很多现在引擎解决的不是很好的case进行交流,提出解决方法。由此大家交流了对下 一代搜索引擎的思考,soso专家提出了情

2011-01-25 15:52:00 15724 1

原创 腾讯搜搜孙良:“情境搜索”更懂你

<br /><br />腾讯soso<br /> <br />【TechWeb】2010年12月9日,谷歌地理位置和本地服务副总裁玛丽莎·梅耶尔透露,谷歌有望明年正式推出“情境发现”服务。而这恰恰与2009年腾讯搜搜提出的“情境搜索”如出一辙。近日,笔者就“情境搜索”的相关问题采访了腾讯搜索技术研发中心总经理孙良。<br /> <br />TechWeb:“情境搜索“是何时提出的?<br />孙良:大概09年初,搜搜开始对情境搜索概念进行内部讨论。其实更早的时候,我们就在考虑搜搜如何去做搜索。09年9月份,

2011-01-25 15:40:00 13904 3

原创 Google Protocol Buffers 实用技术:解析.proto文件和任意数据文件

<br />腾讯soso文/王益<br /> <br />      Google Protocol Buffers 是一种非常方便高效的数据编码方式(dataserialization),几乎在Google的每个产品中都用到了。本文介绍protocol buffers 的一种高级使用方法(在GoogleProtocol Buffer的主页上没有的)。<br />      Protocol Buffers 通常的使用方式如下:我们的程序只依赖于有限的几个protocol messages。

2010-12-30 10:15:00 12403 8

转载 解密”搜索引擎热”:”引擎”价值在哪里

<br /> <br /> <br />核心观点掌握了搜索,也就抓住了互联网经济的制高点谁抓住了搜索引擎,谁就抓住了互联网上信息传递的主动权互联网没有疆域,但利益有疆界,有民族性,有国界基础设施能力和拥有数据资源多少,是另一种形式的“核武器”     <br />      随着网络上信息的不断膨胀,互联网之争,越来越演化为入口之争。而搜索引擎,正是这样的一个入口。“在互联网领域,谁掌握了搜索引擎,就掌握了信息的入口,这背后,是巨大的经济利益,是话语权,是一国信息技术实力和水平的展现。”中国科学院计算技术研

2010-12-28 10:17:00 3848

原创 别让妈妈生气——浅谈长者用户

<br />腾讯设计师文/朱丽娜<br /> <br /><br /> <br />      放假回家难得清闲,奇怪还不到一周就坐不住了,左顾右盼百无聊赖,心里痒滋滋的——原来是网瘾犯了——为了说服父母同意牵网,我承诺他们,保证他们学会上网!<br />      我的计划是:一周之内,教会妈妈浏览网页,教会爸爸上网斗地主。<br />      先剧透一下结局。一周下来,妈妈怒了。在我第500次嘟囔“怎么还学不会”的时候,她吼道:“我这人完全不笨!要么电脑不好,要么是你教得不好,总之是你们不好!”爸爸在

2010-12-14 11:55:00 16426 98

原创 搜索下一站:个性化搜索基本方法和简单实验

<br /> <br />腾讯soso文/王亮<br /> <br />      所谓的个性化搜索,就是将用户输入的关键字和该用户的个人偏好联系起来进行查询,据此猜测该用户可能想要得到的信息,从而将该用户最可能需要的信息显示在最前面。<br />      个性化搜索研究早在上世纪九十年末就已有之,相关的方法和研究已经非常多,但商业化的大规模应用尚未出现。其根本原因在于很少有用户愿意直接或间接提供个人信息,像目前很多实验系统都是采集IP的点击记录、cookie等信息构建用户模型,这样的模型显然也很难精确。

2010-12-02 15:52:00 13954 20

原创 《搜搜月历》:搜搜的马斯洛分析

<br />腾讯soso<br /> <br />      《搜搜月历》是腾讯公司旗下搜索网站搜搜的一个月度精品内容类产品。创刊于2010年4月15日,并发布了第1期。该刊每月10日左右上线,每期16-18个版面,涵盖每月重要时事、网络热点、娱乐体育、流行风尚等多个领域,反映了亿万网民的搜索习惯和互联网的关注方向,登录阅读还可以参与抽奖。往期月历回顾:搜索月历<br /> <br />      11月搜搜新logo上线特刊重磅推出<br /><br /> <br /><br /><br /><br />

2010-11-25 16:55:00 13672 9

原创 搜搜启用全新品牌标识

<br /> <br />      2010年10月26日凌晨,在我们期冀的目光中,搜搜全新品牌标识正式上线了。<br /> <br />      随着搜搜自研引擎、搜索推广系统、无线搜索引擎的成功切换,随着网页直达区、问问、创意图片等特色产品与功能坚持不懈的自我打磨,搜搜对技术创新以及用户理解的坚持,使得搜搜的用户得到快速地增长。5年的积累和发展,让我们共同经历了一个从无到有,从有到有特色的搜搜。而搜搜品牌新标识的启用,正代表了这样一个成长过程。<br />  互联网的快速普及发展,使得用户需求越来越

2010-10-26 18:07:00 7217 26

原创 构建一个高性能的网页抓取器

<br />腾讯soso文/武泽胜<br /> <br />      互联网的发展,使人类提前进入了信息爆炸的年代,在浩瀚无边的信息海洋里,如何快速、准确找到对自己有用的信息,就成了一个很有价值的研究课题,于是,搜索引擎应运而生。现在,国内外大大小小的搜索引擎有很多,搜搜也是这搜索引擎大军中的一员悍将。笔者有幸参与了搜搜研发过程中的一些工作,在这里写一些自己的理解与看法,权当是抛砖引玉,希望能够得到业内前辈们的一些指点。<br />      对于网页搜索引擎来说,它的基本处理流程,通常可以分为三个步骤:

2010-10-25 11:40:00 21141 38

原创 搜搜产品日记——IM聊天助手优化

<br /><br />      QQ聊天助手近期针对右侧结果进行了一些功能优化,新增了表情、股票、词典、天气四类直达区,让你的聊天内容更丰富,更轻松。<br /> <br />新增表情直达区<br />      搜索“搞笑表情”、“兔斯基”、“签到表情”等关键词,即可命中表情直达区。将鼠标放于图片之上,即可进行预览。点击图片即可复制,并发送给好友。<br /><br /> <br />股票直达区<br />      搜索股票代码(如:0700)或股票名称(如:腾讯控股)即可访问股票直达区,快捷的查看

2010-10-22 17:07:00 3438

原创 检索系统的下游管理

<br /> <br />检索系统的下游管理<br />腾讯soso文/黄达文、雷冬冬<br /><br /><br />    搜索引擎的检索系统,是一个复杂的分布式计算系统,往往需要成百上千台机器通过网络连接协同工作,处理用户的检索请求。不仅如此,由于数据分布以及容灾的问题,机器间往往还有上下游、分组、分镜像的关系。本文讲述如何管理这些机器间的拓扑关系。<br /><br /><br /> <br />一、检索系统的整体拓扑<br />    整个检索系统的机器的拓扑关系,类似一个树状的结构,如图1所示

2010-09-30 11:01:00 5983 5

原创 浅谈产品感的培养

<br /> <br /> <br />产品感的具体化以及培养浅谈<br />腾讯soso文/赵世勇<br /> <br />个人简介:<br />赵世勇,soso平台部产品总监。1999年毕业于清华大学自动化系,十年以上互联网产品策划、研发和项目管理经验,2006年进入腾讯。<br /> <br />    关于产品感的具体化以及培养方式,首先要明确圈定产品经理的范围。软件工程师,大家都知道是个什么样的岗位,而产品经理似乎很多人都存在疑问,在招聘、和人聊天的时候,经常会碰到类似的问题。产品经理概念,最早出

2010-08-30 16:16:00 16698 29

原创 人工智能算法—朴素贝叶斯分类

<br /> <br /> <br />文/腾讯soso林世飞<br /> <br />    以下是个人学习贝叶斯分类器—文本分类的学习笔记,和大家一起学习交流。<br />准备工作<br />    监督学习型分类器特点 ,能够从一个不确定度状态开始,通过提供 正确和错误的样本,不断来确定哪些特征(特征由特征提取函数,从样本中提取 )对于分类更重要,可以有很多个分类器,来应对不同的分类或者过滤需求。所以训练本身非常重要。<br />    先来复习下一个数学符号,条件概率:pr(A|B) 给定B条件

2010-08-25 11:37:00 8085 5

原创 人工智能算法- 优化算法

<br /> <br /> <br />文/腾讯soso林世飞<br /> <br />    优化算法通常用来处理问题最优解的求解--这个问题有多个变量共同决定的,举一个例子比如有这样一张人员关系表,需要绘制一张SOSO华尔兹(一种socialnetwork,http://tag.soso.com/),比如:<br /><br />    绘制方法有很多种,我们希望能够最终展现给用户的绘制是比较好阅读的,比如交叉线比较少,每个人的点排的比较开等等。<br />    我们利用以下一个数据格式来描述最终的一

2010-08-16 14:22:00 37200 43

原创 圆一个构建大系统的梦

<br /> <br />    <br />文/腾讯soso邓大付<br /> <br />    邓大付,1997年本科毕业于上海同济大学机械学院。在天津展转3年之后,2000年重返校园,在武汉华中科技大学计算机学院开始了5年的硕博连读历程。2005年4月毕业后,留校任教4个月。于05年8月底正式加入腾讯。现任搜索平台部网页搜索中心下载副总监, 公司的搜索技术专家。<br />       <br /><br /><br />    2005年8月,怀着能参与构建一套使用几千台服务器大型系统的渴望与梦想

2010-07-28 15:35:00 18117 56

原创 spider技术综述

<br /> <br />文/腾讯soso邓大付<br /> <br />    Spider系统是搜索引擎当中进行互联网上数据采集的一个核心子系统。在这个子系统当中,通常先种入一批种子Url,Spider对这些种子Url采集之后将链接提取入库,然后再对新入库的Url进行采集,并且负责对采集过的Url进行更新采集,如此循环。<br /> <br />    随着各种垂直搜索引擎的不断发展,整个Spider在功能上又分为传统的收集互联网上所有数据的大Spider和服务于某个专门领域的聚焦Spider。两类Sp

2010-07-28 15:05:00 9597 12

原创 人工智能算法—决策树

<br /> <br />    文/腾讯soso林世飞<br /> <br />    决策树方法最早产生于上世纪60年代,到70年代末。由J RossQuinlan提出了ID3算法,此算法的目的在于减少树的深度。但是忽略了叶子数目的研究。C4.5算法在ID3算法的基础上进行了改进,对于预测变量的缺值处理、剪枝技术、派生规则等方面作了较大改进,既适合于分类问题,又适合于回归问题<br />    这里 介绍其基本原理 和一个实验例子。<br />    先介绍2个算法:<br />    算法一:熵(

2010-07-22 15:22:00 27949 29

原创 搜索研发的几点感悟

<br />文/腾讯soso杨海松<br /> <br />    杨海松,2003年博士毕业于中国科学技术大学电子工程与信息科学系通信与信息系统专业。2005年加入腾讯公司,负责腾讯搜索的相关性研发工作。通过多年的互联网和搜索领域的研究与实践,在搜索相关性和搜索引擎架构领域积累了丰富的经验,目前担任网页搜索研发中心相关性组的技术总监。<br /> <br /> <br />    2003年,在非典威胁刚刚解除之后,我从中国科学技术大学毕业,告别了培养我九年的母校,来到了深圳。之前的求学生涯对我而言是非常

2010-07-16 14:56:00 7627 4

原创 海量索引数据的机群分布

<br /> <br />文/腾讯soso王志平<br />    索引数据的存储是搜索中很重要的一个环节,在数据量较小的情况下,如普通的中小网站,一般存在的文档数在千万级以下,这个时候,可以简单的实现搜索系统,将所有的索引数据存放在一台机器上。而网页搜索引擎需要索引的数据重量到了上百亿上千亿的级别。因此,需要成千上万台的机器来存放如此巨量的网页数据。那么如何将如此巨量的数据分布存放到这些机器上呢?<br />    较为简便直观的方法是每台机器上存放一定不相同的文档集合,每个机器对不重复的一部分网页文档建

2010-07-13 10:24:00 9512 43

原创 soso的产品思考者

<br />文/腾讯soso李京<br /><br /><br />个人简介:<br />李京,搜索平台部副总经理,2006年加入腾讯,一直致力于Soso产品的策划、设计与战略实施。<br />在搜索引擎行业经历近10年,曾任雅虎搜索高级产品经理,搜狗搜索产品总监等职位。主导各搜索平台的产品工作。<br />热爱互联网,热爱搜索引擎。相信互联网创造美好生活,搜索引擎会带给人类更快速、便捷、准确的信息服务。<br /><br />精彩观点:<br />    搜索,是一个以技术为平台的产品。但是,搜索又是一个

2010-07-08 10:48:00 6719 29

原创 谈搜索架构师的不同阶段

<br /> <br /> <br />文/腾讯soso 乔建秀<br /> <br />    乔建秀,国内早期从事搜索引擎技术的专家,拥有十年的搜索经验。作为搜索首席架构师,2000年-2007年在中搜在线工作。2007年以高端技术专家身份加入腾讯公司。自加入公司以来,全面负责网页搜索的后台技术架构的研发,直到2009年9月soso网页搜索成功上线。目前任命网页搜索平台和公共平台的总监,负责搜索引擎新架构和公共平台的研发工作。<br /> <br /> <br />    搜索技术的应用越来越广,掌握搜

2010-07-01 11:40:00 15619 60

原创 搜索引擎检索技术

<br /> 文/腾讯soso 谢海劝 <br /> <br />    《阿凡达》全球首映,引起轰动,影迷需要对该影片进行全方位的了解,可能需要去腾讯网找资讯,去新浪网找新闻,去优酷网找相关视频,去百度图片找相关图片……,最后去保利电影院的网站定一张电影票。其实事情可以不用如此复杂,打开www.soso.com,输入“阿凡达”,点击“搜索”按钮,用户马上得到关于该影片的资讯、新闻、视频、图片、排档、影院、影评等信息。<br />    如此简单的一个输入框+搜索按钮,却可以实现如此神奇的一站式搜索服务,为

2010-06-28 15:03:00 9330 46

原创 soso六月产品亮点

<br /> <br />Soso六月产品亮点 <br /><br /><br />一、问问box、百科box开发上线<br /><br /><br />    问问box:检索结果多样性提高,增加“更多相关结果”入口<br />    <br /> <br />    百科box:摘要富有化,增加缩略图、目录等信息<br />    <br /> <br />二、本地生活直达区一期上线<br /> <br />    检索规则:城市+地址词+商户词/服务词 (城市可缺省)<br />    覆盖类型:银行

2010-06-22 16:54:00 1698 3

原创 网页分类技术介绍

<br />文/soso  张立明<br />1.   技术背景<br />  分类问题是人类所面临的一个非常重要且具有普遍意义的问题。将事物正确的分类,有助于人们认识世界,使杂乱无章的现实世界变得有条理。自动文本分类就是对大量的自然语言文本按照一定的主题类别进行自动分类,它是自然语言处理的一个十分重要的问题。文本分类主要应用于信息检索,机器翻译,自动文摘,信息过滤,邮件分类等任务。文本分类的一个关键问题是特征词的选择问题及其权重分配。<br /> <br />  在搜索引擎中,文本分类主要有这

2010-06-22 10:58:00 18893 40

原创 初来乍到

<br /> <br />文/soso 产品经理<br /> <br />我是一个普通的应届生,今年3月有幸加入了SOSO。回顾到目前为止的三个月时光,让我感触良多。在每天繁忙的工作里,我不断的成长,不断的了解到以前不曾知晓的东西。<br /> <br />每当一个人要融入一个新集体的时候,总会有些忐忑不安,而这种感觉在入职的那天就立刻被打消了。当我的导师带着我去跟每个同事打招呼的时候,大家都非常热情的与我交流,而且通过交谈还发现了几个校友,那种陌生感和距离感一瞬间就消失殆尽。到午饭的时候,部门的习俗是新进

2010-06-18 18:05:00 2505 12

原创 腾讯soso技术专家系列之总经理孙良

<br />    <br />    孙良,浙江大学信息学院计算机系毕业,硕士。国内较早期从事海量信息检索和搜索引擎技术的研究者。<br /><br /><br />    孙良于2006年加入腾讯,作为SOSO的主要创始人,组建腾讯搜索业务核心技术团队,现为腾讯搜索平台部总经理。经过4年的磨练,带领搜索团队完成了SOSO.COM的搜索产品线建设,共同打造了40多款的腾讯内部专项数据的搜索产品。<br /><br /><br />     SOSO技术团队已经成为了中文搜索引擎领域具有巨大凝聚力和强悍战斗

2010-06-10 15:06:00 7858 25

原创 QQ2010的划词搜索

<br />    <br />    不知道你注意到了没有,qq2010的聊天窗口里面已经支持了划词搜索,聊天与搜索的紧密结合,让你倍感惊喜,赶紧来试试吧!<br />    和朋友聊天时,如果出现了搜索需求,选中需要搜索的词,将鼠标放在被选词上,就会出现下图:<br />              <br /><br /><br />     点击'搜一下',结果就会出现:<br />             <br /><br /><br />     是不是觉得很方便呢?及时的搜索你就可以变成无所不

2010-06-09 17:18:00 1577 12

原创 情境搜索—搜索未来之路

<br /> <br />       腾讯SOSO 总经理 孙良<br /><br />      能想象这样的场景吗?当你和好友聊股票时,上证、深证指数会自动出现你面前;当你和驴友聊旅游时,景点的天气、适宜出行指数、驴友评论等情况会自动出现在你面前...,是的,未来的情境搜索会使得搜索无处不在、无所不能。<br /><br />      传统搜索引擎的局限<br /><br />      通用搜索引擎的特点是通用,它实现了搜索,但并不是为每个人所定制,现实中网络用户的使用习惯千差万别,在搜索结果中反

2010-06-08 15:26:00 4825 22

原创 腾讯Soso团队博客正式开博

<br />    用过soso吗?注意到"  "已经没有了吗?是的,2009年9月soso已经全面换上了自主研发的搜索引擎!<br /><br />    很高兴我们完成了搜索引擎的独立自主,搜索的体验提升离不开大家,所以我们在这里开通了soso的团队博客,希望和你一起分享我们进步的过程。<br /> <br />    Sosoer会随时在这里分享我们的想法、故事以及任何值得分享的东西,这里是一个窗口、一个平台,欢迎关心soso、关心搜索的朋友们经常来。<br /><br />    别忘了,如果对so

2010-06-08 15:13:00 1620 9

空空如也

空空如也

空空如也
提示
确定要删除当前文章?
取消 删除