Python3+Selenium3+webdriver学习笔记10(元素属性、页面源码)

#!/usr/bin/env python
# -*- coding:utf-8 -*-
'''
Selenium3+webdriver学习笔记10(元素属性、页面源码)
'''
from selenium import webdriver
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.support.select import Select
import re
import time,os
import random

# about:addons 火狐浏览器安装组件,访问的地址

# <input id="kw" name="wd" class="s_ipt" value="" maxlength="255" autocomplete="off">
#id
keys="测试部落"
delay=3
# url="https://www.baidu.com/"
url="https://www.cnblogs.com/nicetime"
driver=webdriver.Firefox()

driver.get(url)

# <a href="http://help.baidu.com/question" target="_blank"
# οnmοusedοwn="return c({'fm':'behb','tab':'help','url':this.href,'title':this.innerHTML})">帮助</a>


#标题
title=driver.title
print(title)

#文本
text=driver.find_element_by_css_selector("div#u>a").text
print(text)

#标签名
tagname=driver.find_element_by_css_selector("div#u>a").tag_name
print(tagname)


#获取其他属性
classname=driver.find_element_by_css_selector("input#kw").get_attribute("class")
print(classname)

#获取文本框的输入内容
driver.find_element_by_id("kw").send_keys(keys)
value=driver.find_element_by_id("kw").get_attribute("value")
print(value)

#浏览器名称
print(driver.name)
time.sleep(delay)

page=driver.page_source
print(page)

result_url=[]

url_list=re.findall('href=\"(.*?)\"',page,re.S)
for url in url_list:
if 'http' in url:
result_url.append(url)


print(result_url)
driver.quit()

转载于:https://www.cnblogs.com/NiceTime/p/10066822.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值