2007年08月
以下是广州市某小学四年级的数学题,面对这九道题多数家长只是叹气,少数家长也只会做二三题。愚有感现在的教育并不是在提高文化水平,而是以强硬的手段来制造中国(广州)神童。当今的小孩子的学习压力很大,特别是高中以上的学生,家长们为此操心与操劳就可想而知了。阅读全文>
发表于 @ 2007年08月31日 05:50:00|评论(loading...)|编辑
powerbuilder10在用存储器调用时,retrive时出现错误:造型说明无效的字符值很多网友认为无法解决问题,或者讨论众多,但未见解决之。我通过实践,在一年前即解决。当然,这个问题颇费了我一些时间。(据说原因是ODBC的不兼容问题,因为旧版本的直连方式没问题)1. 编写procedure,如pr_query2. 新增grid的datawindow,选择procedure方式,选择存储器:pr_query,选择手工设置字段。下一步,完成。3. 在界面的dw_1的事件sqlpreview中编写如下代码:阅读全文>
发表于 @ 2007年08月30日 07:27:00|评论(loading...)|编辑
当然我还见过正规的数据库,它没有采用这种字母的分节方法,而是采用模组+数字方式,但原则还是分节,只是更具有系统性。比如INV00100100101,字母在这里起到分模组的标识作用,而后面的数字分三节,而且每个层可以命名999个子模块。可以知道,这是大型系统采用的最好方法。在数据字典的强制作用下,设计和编写都会很规范。并且扩充容易。不容易混乱。对ERP系统等,是最好的方法。(最后的两位用于某表专署的外键等)阅读全文>
发表于 @ 2007年08月29日 22:17:00|评论(loading...)|编辑
此处主要针对新涌现的行业搜索、垂直搜索引擎。累计137家(不包括传统搜索及其分类搜索),这应该是目前最全面的整理结果。
行业搜索:搜索对象针对所在的行业,采用类似传统通用搜索引擎的分词索引技术,返回关键词最匹配的结果。
垂直搜索:搜索对象针对所在的行业,采用数据采集、数据挖掘、数据整理等技术,返回经过加工处理的结果。
阅读全文>
发表于 @ 2007年08月24日 13:51:00|评论(loading...)|编辑
期间:从第一年的后四个月,服务器,线下计算部分需要硬件投入。假设线上部分投入6台服务器,每台成本3W,则是20W元。如果只有两台占用带宽(web server),其它是检索或数据库,则平均算4000/台年,托管需要24000/年。线下部分如果用入门级服务器10台(性能相关部分)和40台pc处理。共需要成本32W元。 三年的总费用约40W.考虑人工开销,总计200W。阅读全文>
发表于 @ 2007年08月20日 18:24:00|评论(loading...)|编辑
今天接到客户需求要作一个电话号码的节点标识系统,来快速查找节点并排除故障,搜了几下没找到资料,就自己写了个草稿。1. 关于电话号码节点查询子系统通讯实体分为:主干信息,机房信息,配线箱信息,联接电缆信息,用户入户信息注意:光纤,xDSL,等同步考虑。...阅读全文>
发表于 @ 2007年08月17日 00:08:00|评论(loading...)|编辑
推荐站点:今天在看我的文章被转载情况,偶然得到该站,不错--人工智能,数据挖掘,数据库(可能是人工收录)阅读全文>
发表于 @ 2007年08月16日 02:21:00|评论(loading...)|编辑
而我们主要的固话部分的主导客户是:企事业,工厂,公司,商铺,个人家庭。一般而言,虽然在手机和移动座机普遍存在的情况下,使得固话部分实际消费额连年下降,而电话号码作为一个单位,个人家庭的标致性还是没有改变。一般的家庭必须得有一部电话,虽然人人都跨着手机。我们可以看出,在企事业,工厂,公司,商铺这四种实体中,日常业务还是主要以固话为主。手机只是个辅助。因为手机目前还只是个人随身使用,没出现固定使用的移动座机概念(在农村比较普遍,电讯和移动的无线座机都存在)。而手机由于使用话费比较高,商业实体普遍使用限制消费额或业务员包月等形式限制个人滥用手机通话,所以除部分出差在外必须使用外,他们会尽可能使用固定电话。所以这些手机消费额造成的整个实体的话费降低值,也应该排除在分析之外。阅读全文>
发表于 @ 2007年08月16日 01:50:00|评论(loading...)|编辑
利用计算机软件代替人工将资源采集到本地,形成一个数据库,再经过人工评价,将评价结果返回用户.半自动方式的工作流程是:用户交互-----选择恰当的关键词----自动采集相关资源----形成主题资源数据库-----资源建设者对结果评价选择-----结果反馈给用户-----结束任务或修正检索式以开始新一轮的采集.与手工方式一样,半自动方式也同样不适合大规模的资源建设.
阅读全文>
发表于 @ 2007年08月15日 01:21:00|评论(loading...)|编辑
网络中的资源非常丰富,但是如何有效的搜索信息却是一件困难的事情。建立搜索引擎就是解决这个问题的最好方法。本文首先详细介绍了基于英特网的搜索引擎的系统结构,然后从网络机器人、索引引擎、Web服务器三个方面进行详细的说明。为了更加深刻的理解这种技术,本人还亲自实现了一个自己的搜索引擎——新闻搜索引擎。阅读全文>
发表于 @ 2007年08月14日 03:09:00|评论(loading...)|编辑
数据挖掘综述 数据挖掘方法论 数据挖掘技术和算法 数据挖掘的一个完整过程 数据挖掘计划的例子
阅读全文>
发表于 @ 2007年08月14日 00:08:00|评论(loading...)|编辑
这里我们主要来介绍一个具有基本功能的Web引擎的实现。本文,我们以类C 语言的形式来描述Web引擎如何采集网页并存放到数据库中的过程。同时描述了如何根据用户输入的关键字查询数据库并得到相关网页的过程。
阅读全文>
发表于 @ 2007年08月13日 23:39:00|评论(loading...)|编辑
在归类过程中,采用三级模糊综合评判。一级指标因素集(网页中出现位置)包括:网页题名、文章标题、第一段首句、第一段尾句、第二段首句、第二段尾句、第三段首句、第三段尾句、首段、尾段、HTML标记。二级指标因素集(词性)包括:名词, 动词, 形容词, 副词, 介词, 连词, 助词, 数字, 符号。三级指标因素集:待分类网页中所包含的全部词语的频数。评价集确定为V={V1(不属于0), V2(不太可能属于0.25), V3(可能属于0.5), V4(很可能属于0.75), V5(属于1)}。 阅读全文>
发表于 @ 2007年08月13日 23:28:00|评论(loading...)|编辑
很多防采集方法在施行的时候需要考虑是否影响搜索引擎对网站的抓取,所以先来分析下一般采集器和搜索引擎爬虫采集有何不同。 相同点:a. 两者都需要直接抓取到网页源码才能有效工作,b. 两者单位时间内会多次大量抓取被访问的网站内容;c. 宏观上来讲两者IP都会变动;d. 两者多没耐心的去破解你对网页的一些加密(验证),比如网页内容通过js文件加密,比如需要输入验证码才能浏览内容,比如需要登录才能访问内容等。阅读全文>
发表于 @ 2007年08月13日 22:37:00|评论(loading...)|编辑
礼貌的抓取具体表现在:网站不让抓取的网页就不要抓取,控制好访问网站的频率,spider的抓取行为不能影响正常用户的访问。因此spider在抓取时要: (1)限制单位时间内对一个网站抓取网页的数量。 (2)限制同时对同一个网站抓取的线程/进程的数量。(3)控制对同一个网站抓取的时间间隔。(4)遵循robots、META Tag 、sitemap.htm协议 ,对不允许访问的目录不访问。(5)在抓取网页的时发送的请求中,通过User-agent、Form字段,标识spider的身份、联系Email、spdier注意事项页面URL。阅读全文>
发表于 @ 2007年08月13日 22:10:00|评论(loading...)|编辑
为什么DTS包成了作业以后就不能正确运行了呢?我们从企业管理器中运行的时候一切正常,但我们把它当成一个作业的时候就不行了。因为它运行不同的环境里,这个环境指的是security context,安全环境或安全上下文。作为程序员你可以在一台工作站前运行程序,那DTS所处的环境就是你面前机器的环境,但如果作为作业,它始终运行在服务器上。阅读全文>
发表于 @ 2007年08月13日 17:58:00|评论(loading...)|编辑
我们可以总结一句话:九城关贸不是想作什么惊天动地的大事,所以会让andylin这样的从事搜索开发的精英失望。而且据闪电般裁员来看,基本就是放弃搜索技术了。它是想购买跟自己业务关系最近的出口贸易企业资料,走捷径而步入B2B领域。如果从这些外贸企业的贡献率来讲,猜想如果有10w家注册企业的话,这个交易还是很划算的,简直太划算了。阅读全文>
发表于 @ 2007年08月11日 19:10:00|评论(loading...)|编辑
这个是北大天网搜索引擎的去重算法(可以参考:《搜索引擎--原理、技术与系统》一书),以上5种算法运行的时候,算法的效果取决于N,就是关键词数目的选取。当然啦,选的数量越多,判断就会越精确,但是谁知而来的计算速度也会减慢下来。所以必须考虑一个计算速度和去重准确率的平衡。据天网试验结果,10个左右关键词最恰当。
阅读全文>
发表于 @ 2007年08月11日 04:11:00|评论(loading...)|编辑
目前这个领域里面很多工作借鉴类似于信息检索的方法来识别相似文档,其本质和SHINGLE等是相同的,都是比较两个文档的重合程度,但是区别是SHINGLE是将若干单词组成片断,粒度比较大,而信息检索类方法其实是用单词作为比较粒度,粒度比较小,粒度越大计算速度越快,而粒度越小计算速度越慢,所以信息检索类方法是不实用的,而且对SHINGLE的改进以及新提出的方法的发展趋势也是粒度越来越大,这样才能解决实际使用中速度的问题。阅读全文>
发表于 @ 2007年08月11日 03:46:00|评论(loading...)|编辑
在发出一个服务请求时,第四层交换机通过判定TCP开始,来识别一次会话的开始。然后它利用复杂的算法来确定处理这个请求的最佳服务器。一旦做出这种决定,交换机就将会话与一个具体的IP地址联系在一起,并用该服务器真正的IP地址来代替服务器上的VIP地址。阅读全文>
发表于 @ 2007年08月10日 21:47:00|评论(loading...)|编辑
但是,只对本地服务器(也就是指本机房服务器)进行负载均衡是不够的,大部分需要负载均衡服务的站点并发访问量都较大,这些站点多数都有异地镜像服务器,因此一些更加专业的 IDC 机房采用的负载均衡设备还可以穿透网络路由,进行异地镜像站点之间的负载均衡,这类负载均衡就称为异地负载均衡(Website Load Balancing)。阅读全文>
发表于 @ 2007年08月10日 21:35:00|评论(loading...)|编辑
已经工作的网民中,学历在大专以上,月收入大于3000元的网民。这一族群的网民大多是高学历、高收入的事业有成者,其中本科及以上学历的比例达到68%,他们的平均年龄约32岁,有相当一部分人是中国最早接触互联网的精英分子,网络早已成为他们工作和生活中不可或缺的一部分。他们在网上浏览新闻、使用搜索引擎和收发电子邮件的比例都高达70%以上,而其他娱乐类活动如聊天、玩游戏的频率则明显偏低。阅读全文>
发表于 @ 2007年08月10日 19:13:00|评论(loading...)|编辑
最多人的首页是hao123或者265,网址站好多网民的上网首页首选。虽然网址站多如牛毛,好多网址站推广都是恶意的,但是用的最多的还是前面提到的两家。再大的网站推出的网址站也无法与这两家抗争了。hao123的访问量惊人我曾经听到过这样一句戏言,如果hao123吧新浪和搜狐的排名换换位置,恐怕他们的世界排名也要颠倒一下了。阅读全文>
发表于 @ 2007年08月10日 19:07:00|评论(loading...)|编辑
html静态化也是某些缓存策略使用的手段,对于系统中频繁使用数据库查询但是内容更新很小的应用,可以考虑使用html静态化来实现,比如论坛中论 坛的公用设置信息,这些信息目前的主流论坛都可以进行后台管理并且存储再数据库中,这些信息其实大量被前台程序调用,但是更新频率很小,可以考虑将这部分 内容进行后台更新的时候进行静态化,这样避免了大量的数据库访问请求。阅读全文>
发表于 @ 2007年08月10日 18:53:00|评论(loading...)|编辑
快速提高博客访问量的22条军规
44个能够提高博客影响力的方法
九大方法提高博客的影响力(一)
九大方法提高博客的影响力(二)
博客推广的终极方式
阅读全文>
发表于 @ 2007年08月10日 15:45:00|评论(loading...)|编辑
在美国的酒类管理体制中,酒基本上被分成了啤酒、葡萄酒和烈酒三类,而且每种酒的进口或批发都需要专门的许可证或执照。这就给我们带来了很大的麻烦,因为无法确定某一家公司到底是经营葡萄酒还是Vodka,到底是进口商还是批发商,在YellowPage中查询到的最小分类是酒(Liquor),而没有更细的分类。当我们找到美国加州酒类管理中心的网站(www.abc.ca.gov)时,这些问题都迎刃而解了。这里不仅按酒的类别、字母的顺序、不同的地域对每个公司进行了分类,而且对于每个公司的信息都有详尽的记录,包括:公司名称、申请人姓名、地址、许可证的种类、许可证的使用期限、经营历史、电话号码等等,真是一个信息宝库。阅读全文>
发表于 @ 2007年08月09日 14:12:00|评论(loading...)|编辑
迅雷由美国杜克大学毕业生邹胜龙和程浩2003年创办于深圳,原名三代科技。邹胜龙出任CEO,程浩则为COO(首席运营官)。依靠他们独有的P2SP技术以及流行的P2P技术为用户提供下载服务。受到众多互联网用户热烈欢迎,同时却让几乎所有互联网宽带提供商切齿痛恨的所谓BT下载,即据于P2P技术。所谓的P2P下载,简单解释,就是下载不再像传统方式那样只能依赖服务器,内容的传递完全在网络的各个终端机器中进行,它使用户拥有“平等”的地位和功能。用户的PC既是服务器也是客户机,所有用P2P软件联接起来的电脑都做到了这一点,因此,用户所能得到的信息不仅仅来自网络中的服务器,同样也可以来自于其他网友的PC机,PC中所有的信息可以让其他网友共享。阅读全文>
发表于 @ 2007年08月09日 11:59:00|评论(loading...)|编辑
在大量数据传递过程,我们经常遇到txt文本到table的import和export 。txt既是通用的形式,也常常是系统之间隔离的最好方法。这里我们讲如何实现本地数据库和远程数据库的同步。1. 远程数据自动定时export到FTP上2. 本地安装CuteFTP软件,设置帐号密码,然后设置两个文件夹同步。自然是本地同步于远程。同步规格为“只要文件更新日期比现在的新则覆盖”。3. 计算时间差,即远程文件到出成文本的时间点,下载到本地的时间,然后在本地设置最合适的启动作业时间。阅读全文>
发表于 @ 2007年08月08日 05:57:00|评论(loading...)|编辑
电讯营业分析报表系统,开发时间1年,用户50人,升级越40次。table251张,存储器42个。数据由DTS或insert bulk 与总公司数据库的文件自动同步。JPG5张图阅读全文>
发表于 @ 2007年08月08日 04:07:00|评论(loading...)|编辑
所以你的blog的原创与转帖文章必了在3:7我觉得是合适的。通常,我们都不是那么容易写出好的文章的,也就是说产量很低的,但我们的思维,需要学习很多,需要参考,既如此,我认为转载的文章达到这个比例是合适的。当然转载需要著名版权和原链接,注明作者署名,注明是转载,并取得作者同意,这个还是要尊重的。更多的,如果你是一个作者,你会从心底很高兴,因为你的文章得到别人评论,赏识,心理还是会很高兴的。这就是现在大家的文章都允许转载。一般的,我们认为,只有转载者大致同意或欣赏原作者的看法,或者文章对转载者本人,或他的群组有用时,他才会乐意转载,因为转载也是一种认可,也是一种宣传。阅读全文>
发表于 @ 2007年08月07日 23:08:00|评论(loading...)|编辑
第4章 Lucene搜索 86
4.1 使用IndexSearcher进行搜索 86
4.1.1 初始化IndexSearcher 86
4.1.2 IndexSearcher的最简单使用 86
4.1.3 IndexSearcher的多种search方法 87
4.2 Hits类详解 89
4.2.1 Hits类的公有接口 89
4.2.2 效率分析 90
4.2.3 Hits内部的缓存 93
4.2.4 Hits类的工作原理 95
4.3 对搜索结果的评分 96
4.3.1 文档与词条的向量空间 96
4.3.2 Lucene的文档得分算法 97
4.4 构建各种Lucene内建的Query对象 100
4.4.1 toString:查看原子查询 100
4.4.2 查询重写与权重 101
阅读全文>
发表于 @ 2007年08月07日 06:42:00|评论(loading...)|编辑
据华盛顿邮报、纽约时报、雅虎及其它媒体综合资料,Google AdSense推出至今已经让很多人取得了丰厚的收入,而全球Google AdSense发布者中有8位的收入明显超过了其他人,以下是这些发布者的排名。阅读全文>
发表于 @ 2007年08月07日 04:44:00|评论(loading...)|编辑
即使google作了机票,生活类垂直搜索,但它仍然不可能花大力气来完善和改进。因为垂直的层面和切法实在太多,垂直搜索的做法和处理的繁杂使得平面搜索不可能随便抽调几个人就可以跟一个公司,一个团队,和一门心思来作某个层面的人相比。李彦宏说过,搜索引擎之所谓失败,就是心思不纯,心有旁骛。google现在是可以连NC也作,电子表格也作,甚至于手机也作,但我们看到,从企业管理角度讲,它现在的确是在走一段发展的上升陡线,还远远没到企业发展的平缓期。到平缓期时,机构庞大,产品众多,业务受到竞争者打压,市场过度竞争,市场饱和,股价低迷,如果真到这个阶段,必然会精简人力,调整产品线,紧缩开支,甚至裁撤部分。所以我本人对google的追捧者,fans的言论都是置之不理的。我想看问题应该不要信神话,应该分析事务的规律,实事求是的看待问题,看待新公司。用QQ PK MSN来反证我想是合适的。
阅读全文>
发表于 @ 2007年08月06日 14:04:00|评论(loading...)|编辑
问题发现了,开始考虑如何解决。现在要做的就是把不同用户的数据分布到不同的服务器上进行存储,以实现数据的分布式存储,让每台机器只为相对固定的用户服务,以实现平行的架构和良好的可扩展性。
为了实现用户分组,我们需要为每一个用户分配一个组标记,用于标记此用户的数据存放在哪一组数据库服务器中。每组数据库由一个master及几个slave组成,并且slave的数量在2-3台,以实现系统资源的最合理分配,既保证数据读操作分布,又避免数据过度冗余以及同步操作对系统资源的过度消耗。
阅读全文>
发表于 @ 2007年08月05日 01:35:00|评论(loading...)|编辑
先在三五台电脑上试验你的模型,可通过有固定IP的地方挂一台电脑当服务器,或者托管一台电脑。在流量没有起来之前,你最多把它当一个试验品,不要冒然出动,最开始你的模型无法达到同类产品的水平,问题很多,比如蜘蛛当机,数据抓取不到,逻辑有矛盾,或者设计有重大缺陷。测试期间,你最好把在线服务器数量定在一台,不要太多,资金方面你无法承受,也是不必要的。因为你还没有访问者,最多就是几个熟人来测试。这个过程反复改进,也许半年,也许一年,也许两年。从单一的技术层面讲,抛开平面搜索的海量和高并发查询这两个因素,垂直搜索的技术复杂性和处理的步骤的繁杂不会低于平面搜索。因为垂直搜索面对更具体的运用,不是处理单一网页一种形式,是多维和多逻辑的。而且资料会准确到逻辑关系式的相等。阅读全文>
发表于 @ 2007年08月04日 14:42:00|评论(loading...)|编辑
作者用编程实例说明了一下问题:值得一看。
1、垂直搜索引擎的定义
2、蜘蛛的主要任务
2.1 检索器
2.2 页面获取
2.3 页面解析
2.4 页面JS解析
3 信息抽取
3.1 列表页面的处理
3.2 详细页面的处理
阅读全文>
发表于 @ 2007年08月03日 23:41:00|评论(loading...)|编辑
这是和BlueBear的聊天记录,是我们在探讨垂直搜索的时候的记录,当然内容也有了些延伸,令我很爽的是和BlueBear的观点很多时候还很一致,嘿嘿!
垂直搜索相关。。引者注阅读全文>
发表于 @ 2007年08月03日 22:47:00|评论(loading...)|编辑
//转载评论:我想未来搜索引擎中,平面搜索主要满足生活热点和普通搜索,而垂直搜索作某个行业,某些层面(不同的剖面都可以叫垂直),还得加上专用搜索(或者叫精准搜索),在我构想得概念里,可能应该有种叫:中国出版物和文献专业检索数据库 这样的搜索才适合专业人士,学者专家使用。
//关于keyword.在好的分词技术,新词发现技术,也是基于统计学的。比如说1000篇文章里同时出现了一个重复出现的文字块,这个文字小块可能就是派生词。比如"地球人都知道"这句广告词,这就是实例。如果很专业,特别是有些根本还未为大家接受,或者说还在论文阶段的词,可能无法收录,也会造成无法收录。比如”长尾“,在这个理论未发布前,这就不是一个词。搜索引擎也是在这个词(或字块)出现后的一段时间,通过统计分析发现这个可能的新词的。然后可能是经过人工再确认,才会参与切词的。大家才能搜索得到。阅读全文>
发表于 @ 2007年08月03日 22:34:00|评论(loading...)|编辑
当我刚进中搜,看到架构组的各个同事是如何编程的时候,我的嘴巴张了一个星期! 头一个星期我的嘴巴是成O型看着他们编程的! 直到那个时候,我才直到,我以前最喜欢的C,C++,我在这上边的编程水平充其量是个刚毕业的!C原来是这么用!数据结构和算法原来是这么用!性能原来是这么省!1T的数据原来是这么处理!架构原来是这样设计!搜索引擎原来是这个样子! 在中搜的前三个月可能是我水平拔高最快的三个月了!基本每一个星期六,星期天我都是在公司度过的!看着前辈们的代码,兴奋啊!阅读全文>
发表于 @ 2007年08月03日 22:07:00|评论(loading...)|编辑
两天时间,连个交接工作的时间都不够,意思已经特别的明显:这一块的将近一年的成果都不要了。为什么这么说那。从一个软件从业者的经验看,如果一个人走的时候没有交接工作,那么他负责的那一块的东西拾起来特别困难。 这是现阶段的大环境决定的。更何况这种的整个裁员!说是把工作交接给SEC部门,我估计,我们做的成果能够保留下来的概率很小。不说别的,单说搜索,这是我们7个人半年多的汗水的结晶!说放弃就放弃了!真是,有钱!这个产品基本上就可以上线了啊!可惜!比原来的单纯按照lucene来的在各个方面好多了!放弃!一夜回到解放前!阅读全文>
发表于 @ 2007年08月03日 22:03:00|评论(loading...)|编辑
依照如此分析,门户网站大有被悬空的趋势。上不着天,下不着地。而机构又如此庞大。但检索只是纯技术方式在工作,与内容提供者还是互为补充,相依为命的吧。只是搜索把持了鼠标,眼球,渠道。这对门户网站来说,实在可恶。试想,如果没有搜索,估计80%的人会从sina,yahoo,sohu的主页开始。想想,也是这些门户极大的悲哀,从经济获利还看是这样。阅读全文>
发表于 @ 2007年08月03日 21:37:00|评论(loading...)|编辑
左边成为相关搜索,推荐搜索,同时根据搜索词在左边提供扩展搜索内容,在这一点上我同时比较喜欢新推出的搜索系统上的词语翻译功能,关于翻译我曾经在搜索引擎的翻译的增补思想里提过(应该说在线翻译工具实用价值还是非常大的,单从一些翻译软件和网站的合作增加的词量就可以看得出来,然而在使用上,常常不是尽如人意。抛开因为某个单词自己弄不懂需要上网查询的人以外。阅读全文>
发表于 @ 2007年08月03日 21:11:00|评论(loading...)|编辑
03年和04年,分别在国内做过三个垂直搜索的网站
第一个是8848.com,copy对象是shopping.com
当时是兼职给他们打工做的,每个月干10天,给8000¥,做了3个月2004.1.1上线运营
我做的时候就不认为这个方向有前途,该网站实质运营了一年,内部即宣告失败
...阅读全文>
发表于 @ 2007年08月03日 20:26:00|评论(loading...)|编辑
大概可以对上面提出的问题给出我的解答了,一个垂直搜索引擎,总体上存在三种出路:
一、只做技术,不做垂直门户,向垂直门户出售技术服务。
二、被资金实力更雄厚,互联网资源更丰富的大型门户网站廉价收购;
三、自己运营一个或多个垂直门户网站,击败缺乏自有技术支撑的同类垂直门户,然后独立上市或高价出售。
阅读全文>
发表于 @ 2007年08月03日 19:43:00|评论(loading...)|编辑
瓦迪建议他们不要继续在免费搜索结果上方发布广告,而是将Google搜索结果页面用一条垂直线分开,2/3用来发布免费搜索结果,1/3置于右边,发布以文本为基础的广告。在同许多人探讨过这个意见之后,布林和佩奇采纳了这个建议。这个做法大幅增加了Google可用于发布广告的空间。它也增加了计算机用户点击广告的几率。他们最初担心这样的改变会使搜索结果的质量看起来降低了。不过,瓦迪这位在商业、财经以及技术领域摸爬滚打多年的老手使他们相信,只要免费搜索结果同广告是明确区分的,搜索结果的完整性就能够保证,而他们的网页看起来就还是干净的,收入则会以更快的速度流入Google。
阅读全文>
发表于 @ 2007年08月03日 19:34:00|评论(loading...)|编辑
如果将搜索竞价排名广告由常规的右边显示逐渐向左边自然信息排名显示领域扩展看做是一种行业趋势的话,那么笔者认为至少应该有一些底线性行规:首先,广告链接数量一定要少,尤其是不能在首页显示信息的左边与右边都是显示广告,那么这就失去了区分的必要;其次,广告链接一定要置顶,一定要用特殊的背景颜色或字体给予标注,从而让网民将其与自然排序的信息区分开来;最后,搜索引擎厂商对于左边显示的竞价广告厂商的资质必须进行实质审核,以避免误捣或欺诈消费者事件的产生。阅读全文>
发表于 @ 2007年08月03日 11:10:00|评论(loading...)|编辑
作为人们进入互联网的主要入口,搜索引擎承担着重要的社会职责,在国外,雅虎、Google、MSN养活了一大批Web2.0网站,网站站长做好网站获得较高的排名,通过来自搜索引擎的流量获得广告收入;在国内,雅虎搜索倡导关键字广告与搜索结果相区分的方式,优秀的个人网站,将由于用户的喜爱而获得较高的排名,获得流量,进而获得广告收入,这将在一定程度上促进、整合良性互联网生态的构建。
阅读全文>
发表于 @ 2007年08月03日 10:57:00|评论(loading...)|编辑
1. AdSense 收入 = 广告展示次数 x 点击率 x 点击单价 x 智能定价因素(Smart Price)
2. 广告展示次数基于你的网站流量,该项代表Adsense广告展示次数。(译注:废话-。-!)
3. 点击率为广告被点击次数÷广告展示次数,基本范围为0.1%-30%,大多数为1%-10%(译注:中文广告偏低,大陆地区平均点击率约0.2%)。
总共93条建议...
阅读全文>
发表于 @ 2007年08月03日 10:51:00|评论(loading...)|编辑
在Facebook允许外部应用程序之前,就已有成百万的用户基本知悉了页面的内部秘密。一个典型的Facebook人每天会花上数小时以发送信息,写日志或博客条目,还有上传照片,以及和那些同样喜欢Decemberists(一支Indie摇滚乐队——译注)的菜鸟女孩进行有趣的交流。Facebook平台不过是扩展了这个交流世界。(据《华尔街时报》报道,从初创到现在,Facebook的主流用户人数已经跃升到了2400万到2700万的水平。)现在你可以查看本地的天气状况,或在线饲养一只虚拟宠物兔,也可以知晓你的朋友们都在听哪些音乐。阅读全文>
发表于 @ 2007年08月02日 18:33:00|评论(loading...)|编辑
扎克伯格:那天我读了苹果乔布斯的一篇访谈,他在里边说:“如果要做成一些事,你必须对它十分、十分热爱,否则就没有任何意义。” 建设Facebook需要付出很多很多,如果你不投入,如果你觉得不是很重要,那是不可思议的。Facebook给我乐趣的一个原因是,我们已经有了一个聪明的团队,他们来自不同的背景,有着不同的经验,以不同的方式思考。许多人老是把我们放在一个桶里:什么时候出售呢?你们要干什么?有什么发展战略?许多人更关心我们为何要招募一个股票专员。然而对我,或者是对于我周围的团队,他们并不是很感兴趣。我们所聚焦的事情正是建设Facebook。阅读全文>
发表于 @ 2007年08月02日 18:13:00|评论(loading...)|编辑
和其它的互联网产品一样,搜索引擎世界也是角色众多,只不过它们都活在Google、Yahoo!、微软Live及Ask四大巨头的背影下,并不显眼。我相信绝大多数的用户日常所使用的互联网搜索引擎应该就是这四个中的一个或多个。尽管几乎每个月都有打着"better than Google"的旗号的新搜索引擎问世,但近几年以来,能真正对四大搜索引擎造成威胁的并不多见。SEO专家Charles从众多的非主流搜索引擎里选出了100个,把它们当作后备搜索引擎而向大家推荐。阅读全文>
发表于 @ 2007年08月02日 16:52:00|评论(loading...)|编辑
电讯业营收管理软件--菜单图示 开发语言PB10+MSSQL2000,支持用户挂接报表,用户挂接程序。开发时间2005.5,现有使用人数200人。更新近百次。电讯业营收软件菜单图[JPG10张]阅读全文>
发表于 @ 2007年08月02日 00:39:00|评论(loading...)|编辑
商业搜索对比分析
以现状来看综合技术实力仅有bseek和b2b8具有可比性,但由于anyso的爬虫和实时索引的底层技术优势,所以在数据实时性和准确性上优势明显,至少领先半年。经两三个月的参数以数据量的扩充,以及前台功能完善,就可以超过所有对手。阅读全文>
发表于 @ 2007年08月01日 22:11:00|评论(loading...)|编辑
相信大家差不多明白了吧?雅虎商业搜索与雅虎搜索结果非常相似,我也试着搜索“橘子”、“电脑”等关键字,搜索结果除了广告,排列的顺序几乎完全一样(不同的就是广告位置而已),雅虎的商业搜索的价值仅仅体现在了广告上而已,并没有任何“商业信息搜索引擎”的价值。阅读全文>
发表于 @ 2007年08月01日 21:45:00|评论(loading...)|编辑