关于python之selenium

为什么要学习selenium

下面这样直接去获取京东数据,是获取不到秒杀数据的,但是我们手动通过浏览器去查看,却是可以查看到的,所以我们需要去模拟人去操作浏览器访问,就可以获取到数据了

# _*_ coding : utf-8 _*_
# @Time : 2023/1/31 15:20
# @Author : 李阶熊
# @File : 为什么要学习selenium
# @Project : pythonProject
import urllib.request

url = 'https://www.jd.com/'

response = urllib.request.urlopen(url)

content = response.read().decode('utf-8')

print(content)

selenium基本使用

# _*_ coding : utf-8 _*_
# @Time : 2023/1/31 15:30
# @Author : 李阶熊
# @File : selenium基本使用
# @Project : pythonProject

# 1 导入selenium
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service

# 2 创建浏览器操作对象
path = 'chromedriver.exe'

s = Service(executable_path=path)
driver = webdriver.Chrome(service=s)

# 3 访问网站
url = 'https://www.jd.com/'

driver.get(url)

time.sleep(10)

content = driver.page_source

print(content)



selenium 元素定位

无界面

# _*_ coding : utf-8 _*_
# @Time : 2023/1/31 15:48
# @Author : 李阶熊
# @File : selenium元素定位
# @Project : pythonProject
# 1 导入selenium
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service


# 2 创建浏览器操作对象
path = 'chromedriver.exe'
s = Service(executable_path=path)
browser = webdriver.Chrome(service=s)

# 操作网站
url = 'https://www.baidu.com'

browser.get(url)

# 元素定位  根据id来找到对象
# button = browser.find_element(By.ID, 'su')
# button = browser.find_element('id', 'su')
# print(button)


# 根据标签属性的属性值来获取对象
# button = browser.find_element('name', 'wd')
# print(button)

# 根据xpath语句来获取对象的
# button = browser.find_element('xpath', '//input[@id="su"]')
# print(button)

# 根据标签的名字来获取对象
# button = browser.find_elements('tag name', 'input')
# print(button)

# 使用的bs4语法来获取对象
# button = browser.find_elements('css selector', '#su')
# print(button)


button = browser.find_element('link text', '视频')
print(button)
time.sleep(4)



selenium 交互

# _*_ coding : utf-8 _*_
# @Time : 2023/1/31 17:37
# @Author : 李阶熊
# @File : selenium交互
# @Project : pythonProject
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service

path = 'chromedriver.exe'
s = Service(executable_path=path)
browser = webdriver.Chrome(service=s)

# url
url = 'https://www.baidu.com'
browser.get(url)

time.sleep(2)
# 获取文本框的对象
input_ = browser.find_element('id', 'kw')

# 在文本框中输入周杰伦
input_.send_keys('周杰伦')

time.sleep(2)

# 获取百度一下的按钮
button = browser.find_element('id', 'su')

# 点击按钮
button.click()

time.sleep(2)

# 划到底部

js_bottom = 'document.documentElement.scrollTop=100000'
browser.execute_script(js_bottom)

time.sleep(2)

# 获取下一页的按钮
next_ = browser.find_element('xpath', '//a[@class="n"]')

# 点击下一页
next_.click()

time.sleep(2)

# 回到上一页
browser.back()

time.sleep(2)

# 回去
browser.forward()

time.sleep(5)

browser.quit()

元素信息以及交互

# _*_ coding : utf-8 _*_
# @Time : 2023/1/31 17:21
# @Author : 李阶熊
# @File : selenium_元素信息以及交互
# @Project : pythonProject
import time
from selenium import webdriver
from selenium.webdriver.chrome.service import Service

path = 'chromedriver.exe'
s = Service(executable_path=path)
browser = webdriver.Chrome(service=s)

url = 'https://www.baidu.com'
browser.get(url)

input_ = browser.find_element('id', 'su')
# 获取标签的属性
print(input_.get_attribute('class'))
print(input_.tag_name)

a = browser.find_element('link text', '新闻')
# 获取元素文本
print(a.text)

selenium 无界面headless

# _*_ coding : utf-8 _*_
# @Time : 2023/2/2 10:37
# @Author : 李阶熊
# @File : selenium_headless
# @Project : pythonProject
# from selenium import webdriver
# from selenium.webdriver.chrome.options import Options
#
# chrome_options = Options()
# chrome_options.add_argument('--headless')
# chrome_options.add_argument('--disable-gpu')
#
# # path是你自己的chrome浏览器的文件路径
# path = r'C:\Program Files\Google\Chrome\Application\chrome.exe'
# chrome_options.binary_location = path
# browser = webdriver.Chrome(chrome_options=chrome_options)
#
# url = 'https://www.baidu.com'
#
# browser.get(url)
#
# browser.save_screenshot('baidu.png')


from selenium import webdriver
from selenium.webdriver.chrome.options import Options

def share_browser():
    chrome_options = Options()
    chrome_options.add_argument('--headless')
    chrome_options.add_argument('--disable-gpu')

    # path是你自己的chrome浏览器的文件路径
    path = r'C:\Program Files\Google\Chrome\Application\chrome.exe'

    chrome_options.binary_location = path
    browser = webdriver.Chrome(chrome_options=chrome_options)
    return browser


browser = share_browser()

url = 'https://www.baidu.com'

browser.get(url)

browser.save_screenshot('baidu.png')
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
本文建立了我国人口增长的预测模型,对各年份全国人口总量增长的中短期和长期趋势作出了预测,并对人口老龄化、人口抚养比等一系列评价指标进行了预测。最后提出了有关人口控制与管理的措施。模型Ⅰ:建立了Logistic人口阻滞增长模型,利用附件2中数据,结合网上查找补充的数据,分别根据从1954年、1963年、1980年到2005年三组总人口数据建立模型,进行预测,把预测结果与附件1《国家人口发展战略研究报告》中提供的预测值进行分析比较。得出运用1980年到2005年的总人口数建立模型预测效果好,拟合的曲线的可决系数为0.9987。运用1980年到2005年总人口数据预测得到2010年、2020年、2033年我国的总人口数分别为13.55357亿、14.18440亿、14.70172亿。 模型Ⅱ:考虑到人口年龄结构对人口增长的影响,建立了按年龄分布的女性模型(Leslie模型): 以附件2中提供的2001年的有关数据,构造Leslie矩阵,建立相应 Leslie模型;然后,根据中外专家给出的人口更替率1.8,构造Leslie矩阵,建立相应的 Leslie模型。 首先,分别预测2002年到2050年我国总人口数、劳动年龄人口数、老年人口数(见附录8),然后再用预测求得的数据分别对全国总人口数、劳动年龄人口数的发展情况进行分析,得出:我国总人口在2010年达到14.2609亿人,在2020年达到14.9513亿人,在2023年达到峰值14.985亿人;预测我国在短期内劳动力不缺,但须加强劳动力结构方面的调整。 其次,对人口老龄化问题、人口抚养比进行分析。得到我国老龄化在加速,预计本世纪40年代中后期形成老龄人口高峰平台,60岁以上老年人口达4.45亿人,比重达33.277%;65岁以上老年人口达3.51亿人,比重达25.53%;人口抚养呈现增加的趋势。 再次,讨论我国人口的控制,预测出将来我国育龄妇女人数与生育旺盛期育龄妇女人数,得到育龄妇女人数在短期内将达到高峰,随后又下降的趋势的结论。 最后,分别对模型Ⅰ与模型Ⅱ进行残差分析、优缺点评价与推广。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值