python爬虫之网易新闻网（简洁版）

最新推荐文章于 2024-05-10 12:36:22 发布

blingbling＊

最新推荐文章于 2024-05-10 12:36:22 发布

阅读量988

点赞数

分类专栏： python爬虫文章标签： selenium csv xpath python

本文链接：https://blog.csdn.net/qq_38112817/article/details/104628665

版权

本文介绍使用Python的selenium库抓取网易新闻网的内容。通过详细注释的代码展示如何解析xpath，将数据保存到csv文件中。文章强调仅为技术交流，不应用于商业目的。

摘要由CSDN通过智能技术生成

网易新闻
爬虫
python

注释挺详细了，直接上全部代码，欢迎各位大佬批评指正。

from selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.by import By
from time import sleep
from lxml import etree
import os
import requests
import csv

# 创建一个无头浏览器对象
chrome_options = Options()
# 设置它为无框模式
chrome_options.add_argument('--headless')
# 如果在windows上运行需要加代码
chrome_options.add_argument('--disable-gpu')
browser = webdriver.Chrome(chrome_options=chrome_options)
# 设置一个10秒的隐式等待
browser.implicitly_wait(10)
# 使用谷歌无头浏览器来加载动态js
def start_get(url,news_type):
      browser.get(url)
      sleep(1)
      # 翻到页底
      browser.execute_script('window.scrollTo(0,document.body.scrollHeight)')
      sleep(1)
      # 点击加载更多
      more_btn = browser.find_elements(By.CSS_SELECTOR, '.load_more_btn')
      if more_btn:
          try:
              more_btn[0].click()
          except E

最低0.47元/天解锁文章

blingbling＊

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
python爬虫之网易新闻网（简洁版）

网易新闻爬虫python注释挺详细了，直接上全部代码，欢迎各位大佬批评指正。from selenium import webdriverfrom selenium.webdriver.chrome.options import Optionsfrom selenium.webdriver.common.by import Byfrom time import sleepfrom...
复制链接

扫一扫

专栏目录