python写一个自动在网页搜索资源并下载的程序

python写一个自动在网页搜索资源并下载的程序

故事起因

关于开题报告,有一件事是不得不考虑的,那就是文献管理,需要自己在网上将所要引用的文章的引用文件下载下来导入管理器中(endnote),如若已经下载好了一百多篇论文!得一个一个去搜下载引用文献文件怎么办?

于是乎,也就有了这个命题——如何写一个python程序自动去网上下载资源

写程序前的准备

除了安装Python(我使用的python3.7)外,还需要安装selenium和pymouse,前者用于操作浏览器,后者用于操作鼠标
关于这两个的安装可以去百度搜,每个人可能遇到的问题都不一样,但都不难解决,大部分需要安装的都可以用pip install解决(什么?你说pip install安装失败?一次不行就两次,两次不行就三次,有一个依赖项我装了5次才成功,所以在这里建议,只要是出来进度条后产生的失败多试几次便能成功,如果超过十次还是不行,建议手动安装。

pymouse需要安装依赖pywin32,详细教程如下面的链接:
https://www.cnblogs.com/SH170706/p/9640110.html

另外还需要安装你所要使用的浏览器的驱动,以便python可以操作浏览器,常用的是火狐和谷歌浏览器,网上关于这两个的教程最多

话不多说,上代码~

代码

import os
import time
from selenium import webdriver
from pymouse import PyMouse

global index
global filenames
global filenames_cl
index = 0
filenames = []
filenames_cl = []
def file_name(file_dir):
    global filenames
    for root, dirs, filenames in os.walk(file_dir):  
        print(root) #当前目录路径  
        #print(dirs) #当前路径下所有子目录  
        print(filenames) #当前路径下所有非目录子文件

file_dir = "D:\我的文档"
file_name(file_dir)
while(filenames):
    file_name = filenames.pop()
    filenames_cl.append(file_name[4:file_name.rfind('_')])

for filename_cl in filenames_cl:
    driver = webdriver.Firefox()#(firefox_profile=profile) #打开火狐浏览器
    driver.get('https://www.cnki.net/'
  • 9
    点赞
  • 77
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值