Python 初识爬虫-**机场出港业务

# -*- coding:utf-8 -*-
from lxml import etree
import requests

##先进单页测试,然后在进行多页循环 没有解决的问题,动态解决最大页数,目前是默认11页
for page in range(1,12):
    for i in range(1,21):##每页都是20条信息,每一行5列信息
        for j in range(1,6):
            ##单页测试
            url = 'http://www.tbia.cn/cn/dynamicflight/dynamicflightInfo/list.do?page='+str(page)
            headers = {
                'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/48.0.2564.116 Safari/537.36'}
            data = requests.get(url, headers=headers)
            data.encoding = 'utf-8'  ##中文乱码解决方案
            s = etree.HTML(data.text)
            info = s.xpath('//table[@class="flighttable"]/tbody/tr['+str(i)+']/td['+str(j)+']/node()')  # **机场
            print(""+str(page)+""+""+str(i)+""+""+str(j)+"")
            list.append(info)
print(list)

##list即为结果

 

转载于:https://www.cnblogs.com/0909/p/9889038.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值