cs101计算机科学入门,udacity公开课:CS101计算机科学入门-001

本文概述了使用Python进行网页数据抓取(通过爬虫)的方法,介绍了如何建立索引以快速匹配关键词,并探讨了Google PageRank在页面排序中的应用。此外,还展示了如何编写简单的计数器程序和在字符串中定位链接的实例。
摘要由CSDN通过智能技术生成

概论

195523a864ea282141079489521dd392.png

1、找数据:爬虫

2、建索引:根据词来匹配

3、页面排序:google pagerank

学python

安装python 廖雪峰官网

写一个程序:输出7周有多少分钟?

print 7*7*24*60

写一个coutdown(3)方法,

输出3,2,1,Blastoff!

def countdown(n):

while n>0:

print n

n=n-1

print "Blastoff!"

语法

Python Grammar for Arithmetic Expressions

表达式-----表达式 操作符 表达式

表达式-----数字

操作符-----+

操作符-----*

数字----0,1,······

参数

名称 = 表达式

speed_of_light = 299792458

字符串

要么都单引号,要么都双引号

‘Hello’ “Hello” ‘"Hello’ “Hello’”

字符串和数字

print 'hello' + 9 error

print 'hello' * 3 hellohellohello

字符串索引

从0开始

name = ‘Dave’

print name[-1]

e

选择子序列

[] --> one-character-string

number

[:]

start num end num

word = 'assume'

print word[3]

print word[3:3]

print word[4,6]

print word[4:]

print word[:2]

print word[:]

u

me

me

as

assume

在字符串中查找字符串

.find()

返回出现的第一个位置

没找到 返回-1

.find(,)

number:从第几个开始查找

没找到返回-1

[number:]

从第几位开始截取

quiz

参数 s=''; t=''; i=;

下列哪一个和 s.find(t,i)结果相等

1、s[i:].find(t);

2、s.find(t)[:i];

3、s[i:].find(t)+i;

4、s[i:].find(t[i:])

answer:以上都不想等

q: 找到一个字符串页面中第一次出现的链接

a:

page = contents of a web page

start_link = page.find('')

start_quote = page.find('"',start_link)

end_quote = page.find('"', start_link+1)

url = page[start_quote + 1:end_quote]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值