图书馆最新购买书籍

欢迎拜访我的新博客~~
http://blog.xieldy.cn

上周写的一个练手的小爬虫,用来自动抓取西电图书馆的最新购买的书籍,程序很简单,直接贴代码:

#encoding=utf8
import urllib

def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html

def content(html):
    content=[]
    nextpart=html
    flag=1
    while flag==1:
        str1= ',t:"'
        nextpart = nextpart.partition(str1)[2]
        str2 = '"}'
        if nextpart.partition(str2)[1]==str2:
            flag=1
        else:
            flag=0
        content.append(nextpart.partition(str2)[0])
    return content
    
def main():
    html=getHtml("http://al.lib.xidian.edu.cn/cgi-bin/newbook.cgi?base=ALL&cls=ALL&date=180")
    a = content(html)
    print "以下为图书馆最新购买书籍:"
    for i in a:
        print i

main()

转载于:https://www.cnblogs.com/xieldy/p/6680742.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值