概论
1、找数据:爬虫
2、建索引:根据词来匹配
3、页面排序:google pagerank
学python
安装python 廖雪峰官网
写一个程序:输出7周有多少分钟?
print 7*7*24*60
写一个coutdown(3)方法,
输出3,2,1,Blastoff!
def countdown(n):
while n>0:
print n
n=n-1
print "Blastoff!"
语法
Python Grammar for Arithmetic Expressions
表达式-----表达式 操作符 表达式
表达式-----数字
操作符-----+
操作符-----*
数字----0,1,······
参数
名称 = 表达式
speed_of_light = 299792458
字符串
要么都单引号,要么都双引号
‘Hello’ “Hello” ‘"Hello’ “Hello’”
字符串和数字
print 'hello' + 9 error
print 'hello' * 3 hellohellohello
字符串索引
从0开始
name = ‘Dave’
print name[-1]
e
选择子序列
<string>[<expression>] --> one-character-string
number
<string>[<expression>:<expression>]
start num end num
word = 'assume'
print word[3]
print word[3:3]
print word[4,6]
print word[4:]
print word[:2]
print word[:]
u
me
me
as
assume
在字符串中查找字符串
<string>.find(<string>)
返回出现的第一个位置
没找到 返回-1
<string>.find(<string>,<number>)
number:从第几个开始查找
没找到返回-1
<string>[number:]
从第几位开始截取
quiz
参数 s='<any string>'; t='<any string>'; i=<any number>;
下列哪一个和 s.find(t,i)结果相等
1、s[i:].find(t);
2、s.find(t)[:i];
3、s[i:].find(t)+i;
4、s[i:].find(t[i:])
answer:以上都不想等
q: 找到一个字符串页面中第一次出现的链接
a:
page = contents of a web page
start_link = page.find('<a href=>')
start_quote = page.find('"',start_link)
end_quote = page.find('"', start_link+1)
url = page[start_quote + 1:end_quote]