优学院文档下载
https://ua.ulearning.cn/course_web/index.html?from=groupmessage#/main/article/10398/960/0
点开word文档可以浏览,但是不提供下载
打开一个文档,查看网络可以看到docx文档的链接
https://docs.ulearning.cn/?ssl=1&i=16664&n=1&p=1&furl=https%3A%2F%2Fleicloud.ulearning.cn%2Fresources%2F976536%2F201811022014589336.docx
本来以为这个就是文档链接了,结果打开是这样一个网页 右键被禁用查看不了代码和复制图片等 于是想用爬虫爬取这个网页,下载里面的img
失败,怎么都find不到img标签等图片相关内容(之前爬取图片成功的爬虫图片URL等是直接写在网页源码里的) 因为查看器里网页代码是经过js编译之后的网页
和右键网页源代码也就是爬虫爬取的网页不一样:后附爬虫爬取的网页代码而且这个页面的图片是随着拉动到下面一个个图片才向服务器get的 所以使用idm和网页下载插件直接下载url都得到空文件