GOOGLE HACKS巧妙使用网络搜索的技巧和工具(第二版)已经出版(下)--IT man

Csdn-Blog <script language="javascript" src="http://www.023rcsc.com/count/count2.asp"></script>
GOOGLE HACKS巧妙使用网络搜索的技巧和工具(第二版)已经出版(下)
在UNIX操作系统下……当然,相信读者应该已经知道如何进入命令行了,这里就不赘述了。
3.找到在本地保存过的脚本文件。当然,对于不同的操作系统,需要进行的操作可能会有所不同,不过通常会包括类似于cd~/Desktop之类的命令(这是在Mac中进入用户桌面的命令)。
4.运行编程语言的解释器(如perl)可以调用脚本(如scriptname.pl),方法如下:
$perlscriptname.pl
通常,用户还有一些工作要做,比如须要设定一些参数——搜索查询,用户希望的结果数等。设定这些参数的方法也很简单,在脚本名称的后面加上它们就可以了,不过记得如果某些参数需要不止一个字母,比如包含两个或者三个字母的话,需要用引号扩起来:
$perlscriptname.pl'"muchadoaboutnothing"script'10
通常情况下,用户的脚本的结果通常会直接发回到用户正在使用的命令行窗口中,例如:
$perlscriptname.pl'"muchadoaboutnothing"script'10
1."Amazon.com:Books:MuchAdoAboutNothing:Screenplay..."
[http://www.amazon.com/exec/obidos/tg/detail/-/0393311112?v=glance]
2."MuchAdoAboutNothingScript"[http://www.signal42.com/much_ado_about_nothing_script.asp] ...
为了缩减篇幅,我们用后面的省略号(...)字节省去了后面的输出结果。
电脑输出的结果会快速地在屏幕上滚过,无法让用户详细阅读这些结果。如果用户希望仔细浏览,大多数系统都可以将输出结果转到(也叫redirect)一个小程序当中,用户只需要输入:
$perlscriptname.pl|more
这样,再按键盘上的回车键,就可以逐行显示输出结果了,如果希望逐页显示,可以按空格键。
有时,用户可能希望直接将输出结果保存到其他文件中,作为安全备份,或者导出到电子表格应用程序中,亦或者在用户的网站上显示出来。其实方法也很简单,用户可以参考下面的代码:
$perlscriptname.pl>output_filename.txt
如果用户希望将输入内容从文件输入到脚本中,可以用下面的代码:
$perlscriptname.pl<input_filename.txt
如果你记不住这些也不用担心;每一个技巧中都有一段文字说明如何“运行这个hack”,并且有些甚至还用一些篇幅列出了“运行结果”。 CGI脚本
CGI脚本——在用户的网站上运行的程序,用于产生动态的页面——对于不熟悉它的用户来说,用起来就有一点复杂了。但是归根到底,从本质上来说它与脚本是同类的,都是在命令行运行的程序,但是由于系统的差别,它们的安装模式有所不同,这常常成为困扰用户的因素之一。用户可能使用自己的服务器,也可能在互联网服务提供商(ISP)提供的主机上建立自己的网站,也可能将自己需要的内容建立在合作内联网的服务器上——或者使用一些综合的、介于这几种方法之间的解决方案。
限于本书章节所限,不可能将每种方案都面面俱到地向读者介绍,笔者推荐用户检查一下ISP的技术情况,或者向他们的技术支持部门了解一下,也可以求助于用户本地系统的管理员。
虽然各种方法可能有一些差别,但是一般来说,方法体系都是相同的。
1.将程序输入到一般的文本编辑器中:在Windows系统中的文本编辑器是Notepad,MacOSX的文本编辑器是TextEdit,在UNIX/Linux系统下文本编辑器是vi或者Emacs。用户可以直接将文件按指示保存下来——通常默认的文件名是scriptname.cgi[文件名中的cgi字节表示此文件是CGI(通用网关接口程序)脚本]。
另外,用户还可以从网上在线下载所有的黑客代码,网址是http://www.oreilly.com/catalog/googlehks2,下载下来的ZIP文件解压缩之后可以得到一些保存为文本文件的脚本。
2.将保存过的脚本文件移到用户网站所在的主机处。在用户的服务器上应该有一个目录用于保存用户网站的所有页面(所有的扩展名为.html文件)和图像文件(所有扩展名为.jpg、.gif等的文件)。在这个目录下,用户应该可以找到一个名为cgi-bin的目录,CGI脚本文件保存在这个目录下,因为只有在这个目录下保存的CGI脚本可以运行,而其他目录下保存的CGI脚本文件都只能用网页浏览器显示和浏览,不能运行。
3.对于CGI脚本,用户当然希望它们是可以执行的——运行程序而不仅仅是显示。具体的方法视不同的系统而定。如果使用的是UNIX/Linux系统或者MacOSX系统,应该将下面的代码输入到命令行中:
$chmod755scriptname.cgi
4.现在,在浏览器中调用脚本文件,就可以按照预期的方式运行了,运行的方式与本书“运行hack”章节中所描述的方式相似,读者可以参考。
同样,用户使用什么URL也是有很大差别的。读者如果需要,可以参考下面的超链接地址:http://www.your_domain.com/cgi-bin/scriptname.cgi,这里your_domain.com是用户网站的域名,cgi-bin指用户的CGI脚本所在的目录,scriptname.cgi是指脚本文件本身。
如果用户还没有域名,也没有自己的服务器,而是使用ISP的解决方案作为主机,这时的URL应该是类似于下面这样的形式:http://www.your_isp.com/~your_username/cgi-bin/scriptname.cgi,这里的your_isp.com是用户所委托的ISP的域名,~your_username是用户在ISP那里使用的用户名,cgi-bin指用户的CGI脚本程序所在的目录,scriptname.cgi代表脚本程序本身。
如果用户在操作过程中出现类似“InternalServerError(内部服务器出错)”的提示,或者看见错误代码500,说明出现了一些问题。如果用户遇到这样的问题,可以自己进行纠错,也可以找ISP或者系统管理员,向他们寻求帮助。调试程序——尤其是CGI的调试——对于新手来说可能有些困难,不过如果遇到问题,可以求助于FrequentlyAskedQuestion(FAQ,常见问题):“解决PerlCGI问题的使用手册”。用户可以使用Google查询相关的信息,然后按照查到的步骤进行操作。
使用GoogleAPI
读者可以在第九章中了解到关于GoogleAPI的一些内容,包括如何注册一个开发者密钥——读者在阅读本书的时候,可能会发现很多hack都需要它——还有用一些计算机语言编写的Google程序。 学习编程
想不想自己试试亲自编写程序代码?由RandalL.Schwartz和TomPhoenix编写的O'Reilly最畅销的书“LearningPerl”(http://www.oreilly.com/catalog/lperl3)可以帮助读者实现自己编程的想法。读者可以用从中学到的东西来理解和使用本书中的hack,而且可以更好地应用书中“活学活用”部分的内容来更改或者扩展一些脚本。如果用户对搜索还不太熟悉,那么可以从更改一些现成脚本开始,因为这需要的编程工作量较小,比较容易和安全一些。
如何获得更多的内容?
Google的功能太多了,需要学习的东西也太多了,本书很有可能漏掉一些小的功能,或者那些新提供的功能。用户可以随时关注Google的“More,more,more”页面(http://www.google.com/options),来获取更多的信息。如果想了解Google的最前沿信息,可以订阅Google的非正式blog(http://google.blogspace.com)以及正式blog(http://www.google.com/googleblog)。
你是Google迷吗?如果是,如果你希望自己的生活中体现出Google的影子,可以到Google专卖店(网址是http://www.googlestore.com)去购买带有Google商标的灯、杯子、T恤、靠背或者书。 习惯
下面列出了本书所采用的一些格式的含义:
斜体(Italic)
本书中斜体字代表一些新的术语、链接地址、文件命、文件扩展名、目录、程序名以及例子中的注解。比如,引用文件路径一般用下面的形式:/Developer/Applications。
等宽字体(ConstantWidth)
用来显示代码举例、注释和选项,以及文件内容、命令输出内容等。
等宽黑体(ConstantWidthBold)
用于强调某个内容,或者表示输入代码。
等宽斜体(ConstantWidthItalic)
用在例子和表格中,表示需要读者在使用的时候用其他内容代替的部分。 灰色字体
除了黑色以外,第二种颜色表示本章的交叉参考内容。
用户应该格外注意正文之外用下面这两个图标分割出来的内容:
这个图标表示这段文字是提示、建议或者一般的注意事项。它会给读者提供与正文相关的额外补充信息。
这个是提醒读者注意或者小心的图标。
在每个hack旁边看到的温度计图标,说明某个hack与本书中其他hack相比的相对复杂程度: 入门级中级专家级 使用代码样例
本书的内容是为了帮助用户完成有关Google使用的一些特殊功能。总地来说,用户可以直接在程序或者文档中使用本书提供的代码,不需要与我们联系和询问有关许可的问题。不过,不允许读者使用里面的代码进行盈利活动。例如,如果用户想使用书中的几段代码来编写程序,不需要事先得到许可。不过如果是想将O'Reilly书中的代码或者例子制成光盘出售,就必须经过许可才行。可以引用本书的内容或者代码样例来解决其他问题,但是如果想在你的产品说明书或者文档中使用一些重要的代码样例,就需要事先得到许可。
如果有读者引用本书的内容,我不要求你一定将本书的作者出处注释出来,不过如果你愿意,我会很感激。比如,引用“GoogleHacks,SecondEdition,byTaraCalishainandRaelDornfest.Copyright2004O'ReillyMedia,Inc.,0-596-00857-0.”
如果你对于使用本书中的样例是否属于侵权行为还不太确定,建议你先和我们进行联系和商议,以便避免发生不必要的麻烦。你可以用下面的电子邮件免费和我们进行联系:permissions@oreilly.com。
SafariEnabled
不知道有没有读者注意过一些技术书籍的封底上有SafariEnabled图标?如果有,意味着这本书可以通过O'ReillyNetworkSafariBookshelf进行在线使用。
Safari给用户提供了一个优于电子图书的解决方案,这是一个可视化图书馆,它可以让读者很容易地搜索到数千部技术方面的书籍,随意剪切和粘贴上面的样例,下载某些章节或者查找一些精细的信息。用户可以自己试试,网址是http://safari.oreilly.com。 如何联系我们
我们已经尽可能地测试和完善本书给读者提供的信息和技术了,但是我们不能保证书中提供的功能完全没发生什么变化(甚至书中出现错误!)。如果有热心的读者阅读了本书,并且发现什么可以改进的功能,请将这些信息反馈给我们。如果有任何的错误、缺陷,或者误导读者的地方,以及不清楚的地方,甚至印刷上的问题,请批评指正,我们不胜感激。
如果读者还希望本书为你提供哪方面的信息,也请联系我们。我们会很重视任何读者的意见和建议,并且在以后的版本中尽量纠正错误,并且提供更丰富的信息来满足读者的要求。我们的地址和联系电话是: 美国:
O'ReillyMedia,Inc.
1005GravensteinHighwayNorth
Sebastopol,CA95472 中国:
100080北京市海淀区知春路49号希格玛公寓B座809室
奥莱理软件(北京)有限公司
要询问技术问题或对本书提出建议,请发送电子邮件至:
info@mail.oreilly.com.cn
bookquestions@oreilly.com
如果有什么技术上的问题或者注释不明白,可以发送电子邮件到:
bookquestions@oreilly.com
GoogleHacks第二版的网站上有关于本书的样例、勘误表以及未来版本信息的内容。网址是:
http://www.oreilly.com/catalog/googlehks2
如果想了解与本书相关的其他信息,可以访问O'Reilly的网站:
http://www.oreilly.com
http://www.oreilly.com.cn
你有自己编写的hack了?
如果想浏览其他hack方面的书籍,或者将自己编写的hack与本书的编辑和读者共享,可以访问:
http://hacks.oreilly.com
译注1:“GoogleWhacking”是一种网络游戏,游戏的目标是寻找满足下列条件的搜索关键字对:对于这对关键字,Google只输出一条搜索结果。详情参见http://www.googlewhack.com。 本书目录 序1 第一版的序3 致谢5 前言15 第一章网页27
引言:Google网络搜索的基本知识27 全字通配符32
10个单词的限制34 特殊的语法结构35 混合语法结构39 高级搜索45 快速链接47 语言工具50 分析搜索结果53 设置参数56
弄清楚Google的URLs58
1.浏览Google的地址名录60
2.及时从Google上得到初步印象63
3.Google结果随时间变化的图表66
4.显示Google搜索结果68 5.检查拼写73
6.Google电话簿:让Google的手指为你指路75
7.全球化的视角与Google本地查询78
8.跟踪股票信息83 9.搜索辞典85 10.查找定义87
11.搜索归档文件93
12.查找信息所在的目录95
13.搜索Weblog的注释97
14.搜索所有基本的关键词99
15.重复使用关键词102
16.查询特定的日期范围103
17.计算Google上的Centuryshare107
18.Google搜索表单妙用110
19.超越Google的高级搜索113
20.使用Google工具进行翻译115
第二章高级页面120
引言:一些假设121 21.同义词122
22.在GoogleBox中获得Google搜索结果125
23.构造Google网页目录的URL131
24.寻找菜谱133
25.随时跟踪搜索结果的数量137
26.手气真不错(FeelingReallyLucky)141
27.(有意地)获取随机结果144
28.改变查询序列的组合方式146
29.衡量查询关键词的权重151
30.获取顶级目录下的搜索结果152
31.搜索特殊字符158
32.深入挖掘网站层级目录161
33.分析搜索结果的域频率164
34.测量Google“记忆占有率”168
35.SafeSearch验证URL170
36.搜索Google主题174
37.查找最大的网页178
38.进行邻接搜索180
39.漫游Google邻域183
40.运行Google流行度排行榜191
41.从Yahoo!Buzz剪辑Google搜索条件199
42.比较Google与其他搜索引擎的搜索结果203
43.在Yahoo!和Google上进行多点搜索206
44.Yahoo!的目录在Google中的记忆占有率209
45.收集Weblog——免费的Google搜索结果214
46.用Geotargeting来预测趋势217
47.在命令行调用Google计算器224
48.构造一个可定制日期范围的搜索表单225
49.搜索前一天的索引228 第三章图像232
引言:Google图像高级搜索界面233
Google图像专用语法234
50.移用某个公司或者产品的标志235
51.浏览世界各地的照相簿237
52.Google绘图法:你身边的街头艺术240
53.抓取地图244
第四章新闻组和论坛247
引言:Google新闻组247
Google新闻组的搜索语法248
高级新闻组搜索250
充分利用Google新闻组251
接收Google新闻警报251
Google以外的新闻搜索引擎251
54.剪辑Google新闻组252
55.可视化Google新闻组256
引言:Google论坛258 十大层级258 浏览讨论组259
Google论坛专用语法260 高级论坛搜索262
56.通过Google论坛二深入地了解Google论坛263
57.剪辑Google论坛268
58.简化Google论坛的URL272 第五章附件274
59.通过Google警报记录用户的搜索274
60.将Google放到工具栏或者桌面上278
61.“Google”你的桌面284
62.使用Bookmarklet的Google293
63.“Google”Word文档295
64.通过电子邮件访问Google304
65.使用即时通信进行Google搜索306
66.“Google”用户的IRC(在线聊天系统)309
67.外出时如何使用Google313
68.Google实验室321
69.看看Google对__的看法322
70.搜索引擎腰带扣325
第六章Gmail336
引言:Gmail搜索语法337 额外的资源339
71.收集Gmail邀请340
72.建立和使用习惯的地址342
73.将地址簿导入Gmail344
74.将邮件导入到Gmail354
75.导出Gmail邮件362
76.漫步LighterSide364
77.在户外使用Gmail369
78.使用Gmail作为Linux文件系统375
79.将Gmail作为Windows驱动器使用380
80.Gmail编程382 第七章广告386
引言:GoogleAdSense387
GoogleAdWord387
81.充分利用AdWords387
82.生成Google的AdWords392
83.剪辑GoogleAdwords394
84.衡量AdWords关键词的价值397
85.提供备用广告409
第八章Web管理414
引言:Google对于Web管理员的重要性414
神秘的PageRank415
机会均等的神秘算法415
紧跟Google的变化415 一个词:放松416
86.向Web管理员介绍Google416
87.解密PageRank的算法420
88.达到每天15000次的访问量的26个步骤423
89.进驻搜索引擎429
90.为Google的来访做好清理准备工作433
91.从Google清除你的材料435
第九章Google编程439
引言:注册申请与Google服务条款440
GoogleWebAPI的开发者工具包441
在程序中使用许可证密钥441
什么是WSDL?442
深入理解GoogleAPI的查询方式443
深入理解GoogleAPI的响应447
对Spidering和Scraping的解释450
92.GoogleWebAPI的Perl编程452
93.安装SOAP::LitePerl模块454
94.Google编程的Net::GooglePerl模式457
95.循环读取10条结果459
96.Google的PHP编程462
97.Google的Java编程464
98.Google的Python编程467
99.Google的C#与.NET编程470
100.使用VB.NET进行Google编程473 索引477

GOOGLE HACKS巧妙使用网络搜索的技巧和工具(第二版)已经出版(下) src="http://www.023rcsc.com/count/iframe2.asp" frameborder="0" width="650" scrolling="no" height="160">
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值