爬取奇迹秀工具箱里面的文本和软件网盘链接

1.爬取的网址:http://www.qijishow.com/down/index.html
在这里插入图片描述
2.完整代码展示

from selenium import webdriver
import time

url = 'http://www.qijishow.com/down/index.html'
opt = webdriver.ChromeOptions()
opt.add_argument("--headless")
driver = webdriver.Chrome(chrome_options=opt)
# driver = webdriver.Chrome()
driver.get(url)
k = driver.find_elements_by_class_name("sm-6")

for i in range(1, len(k) + 1):
    print(i)
    # try:
    print("---------------开始----------------------")
    a = driver.find_element_by_xpath(
        f'//*[@id="page"]/div[4]/div[1]/div[3]/div/div[{i}]/div/a/div[1]/img').get_attribute("data-src")
    a1 = 'http://www.qijishow.com/down/' + str(a)
    b = driver.find_element_by_xpath(f'//*[@id="page"]/div[4]/div[1]/div[3]/div/div[{i}]/div/a/div[2]').text
    print("软件图片地址链接:", a1)
    print("软件名字:", b)
    time.sleep(2)
    # driver.find_element_by_xpath(f'//*[@id="page"]/div[4]/div[1]/div[3]/div/div[{i}]/div/a/div[1]/img').click()

    ele=driver.find_element_by_xpath(f'//div[@class="row"]/div[{i}]')
    driver.execute_script("arguments[0].scrollIntoView()", ele)
    ele.click()
    print("11111111111")
    time.sleep(2)
    windows = driver.window_handles
    driver.switch_to.window(windows[-1])
    p = driver.find_element_by_xpath('//*[@id="resources"]').text
    print(p)
    u = driver.find_elements_by_xpath('//img')
    src = []
    for j in u:
        o = j.get_property('src')
        src.append(o)
        print('文章图片地址:', o)
    r = driver.find_element_by_xpath('//*[@id="download"]/a[@id="local"]').get_attribute('href')
    print("官网地址:", r)
    try:
        x = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[2]/p').text
        y = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[2]/a[1]').get_attribute('href')
        print(x, y)
    except:
        x = "没有"
        y = "没有"
    try:
        z = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[3]/p').text
        h = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[3]/a[1]').get_attribute('href')
        print(z, h)
    except:
        z = "没有"
        h = '没有'
    with open("爬虫/{}.txt".format(i), "w", encoding="utf-8") as f:
        f.write("软件图片地址链接:" + a1 + '\n')
        f.write("软件名字:" + b + '\n')
        f.write(p + '\n')
        f.write('文章图片地址:' + str(src) + '\n')
        f.write("官网地址:" + r + '\n')
        f.write(x + "Mac版百度网盘地址:" + y + '\n')
        f.write(z + "Win版百度网盘地址:" + h)
    driver.close()
    driver.switch_to.window(windows[0])
    print("---------------结束----------------------")
    # except:
    #     pass

3.爬取的文档展示

在这里插入图片描述
4.爬取并保存为表格完整代码

from selenium import webdriver
import time
import csv
url = 'http://www.qijishow.com/down/index.html'
opt = webdriver.ChromeOptions()
# opt.add_argument("--headless")
# driver = webdriver.Chrome(chrome_options=opt)
driver = webdriver.Chrome()
driver.get(url)
k = driver.find_elements_by_class_name("sm-6")
with open("交互设计.csv", "w", newline="", encoding="utf-8-sig") as datacsv:
    csvwriter = csv.writer(datacsv, dialect=("excel"))
    csvwriter.writerow(["软件图片地址链接", "软件名字", "富文本", "官网地址", "Mac版下载", "Win版下载"])
    for i in range(1, len(k) + 1):
        l=[]
        print(i)
        try:
            print("---------------开始----------------------")
            a = driver.find_element_by_xpath(
                f'//*[@id="page"]/div[4]/div[5]/div[3]/div/div[{i}]/div/a/div[1]/img').get_attribute("data-src")
            a1 = 'http://www.qijishow.com/down/' + str(a)
            b = driver.find_element_by_xpath(f'//*[@id="page"]/div[4]/div[5]/div[3]/div/div[{i}]/div/a/div[2]').text
            print("软件图片地址链接:", a1)
            print("软件名字:", b)
            l.append(a1)
            l.append(b)
            # driver.find_element_by_xpath(f'//*[@id="page"]/div[4]/div[1]/div[3]/div/div[{i}]/div/a/div[1]/img').click()
            ele=driver.find_element_by_xpath(f'//*[@id="page"]/div[4]/div[5]/div[3]/div/div[{i}]/div/a/div[1]/img')
            driver.execute_script("arguments[0].scrollIntoView()", ele)
            time.sleep(2)
            ele.click()
            windows = driver.window_handles
            driver.switch_to.window(windows[-1])
            p = driver.find_element_by_xpath('//*[@id="resources"]').get_attribute('outerHTML')
            print(p)
            l.append(p)
            r = driver.find_element_by_xpath('//*[@id="download"]/a[@id="local"]').get_attribute('href')
            print("官网地址:", r)
            l.append(r)
            try:
                x = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[2]/p').text
                y = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[2]/a[1]').get_attribute('href')
                print(x, y)
                l.append(x+" "+y)
            except:
                x = "没有"
                y = "没有"
                l.append(x+" "+y)
            try:
                z = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[3]/p').text
                h = driver.find_element_by_xpath('//*[@id="zoom_download"]/div[3]/a[1]').get_attribute('href')
                print(z, h)
                l.append(z+" "+h)
            except:
                z = "没有"
                h = '没有'
                l.append(z+" "+h)
            csvwriter.writerow(l)
            driver.close()
            driver.switch_to.window(windows[0])
            print("---------------结束----------------------")
        except:
            pass

5.爬取的表格展示
在这里插入图片描述

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
MATLAB雷达工具箱是一种专门用于雷达信号处理和分析的工具包,它提供了一系列用于处理雷达信号的函数和工具。MATLAB雷达工具箱通过其强大的信号处理和数据可视化功能,为用户提供了一种方便快捷的方式来分析和处理雷达数据。 MATLAB雷达工具箱拥有丰富的功能模块,包括雷达信号生成、波束形成、目标检测和跟踪、信号处理和特征提取等。用户可以根据自己的需求选择适合的模块进行使用,从而实现对雷达数据的全面分析和处理。 使用MATLAB雷达工具箱,用户可以对雷达信号进行各种常见的处理操作,如滤波、时频分析、谱估计、参数估计等,使得雷达数据的处理更加简单和高效。同时,MATLAB雷达工具箱还提供了多种可视化方法,使用户能够直观地观察和分析雷达数据,包括雷达图像的显示、目标跟踪轨迹的显示等。 网盘是一种将文件以在线形式存储并进行分享的存储平台。将MATLAB雷达工具箱上传至网盘,可以方便用户在各个设备上进行访问和使用。用户可以通过将工具箱上传至网盘,节省本地存储空间,同时也可以与他人分享和协作。 总而言之,MATLAB雷达工具箱是一种功能强大的工具包,通过网盘方式将其上传,可以方便地存储、共享和使用雷达数据。这为用户提供了一种便捷的方式来进行雷达信号处理和分析。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

萧鼎

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值