selenium的进阶1

# -*- coding: utf-8 -*-
"""
Created on Sat Oct 22 18:14:07 2016

@author: alis
"""

from selenium import webdriver
import time,urllib2
from bs4 import BeautifulSoup
browser = webdriver.Firefox()

#设置浏览器窗口的位置和大小
browser.set_window_position(20, 40)
browser.set_window_size(1100,700)

browser.get('http://portal.gd-n-tax.gov.cn/pub/gzsgsww/bsfw/nszx/rdwt/')       #打开网站
time.sleep(2)             #缓冲2秒

###---------------------------example
soup = BeautifulSoup(browser.page_source,'lxml')       # 使用beautifulsoup库解析网址
a = etree.HTML(browser.page_source)                               #使用lxml库解析网站
for i in a.xpath('//div[@class="newslist"]//@href'):
      
    j = 'http://portal.gd-n-tax.gov.cn/pub/gzsgsww/bsfw/nszx/rdwt'+i[1::]
    browser.get(j)
    time.sleep(2)
    Html = etree.HTML(browser.page_source)
    print Html.xpath('//div[@class="contenttitle"]//text()')

print browser.title

#通过get方法获取当前URL打印
url = 'http://www.baidu.com'
print "now access %s" %(url)
browser.get(url)











评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值