javascript:打开窗口交付("http://bibliotecadigitalhispanica.bne.es:80/webclient/DeliveryManager?application=DIGITOOL-3&owner=resource discovery&custom_att_2=simple_viewer&forebear_coll=1333&user=GUEST&pds_handle=&pid=1673416&con_lng=SPA&rd_session=http://bibliotecadigitalhispanica.bne.es:80/R/7IUR42HNR5J19Ay3QJTL1P9M2AN81RCY4DRFE8JN5T22BI7I-03416“)
该URL指向302页。如果你遵循它,你会在一个框架页面结束,那里的底部框架是内容页面。在
(lib)curl可以跟随302页。在
到目前为止,Javascript还不是问题所在。然后进入single_viewer_toolbar2.jsp,函数setLabelMetadataStream在将pdf提交给其iframe“sendRequestIFrame”之前,将其组合在一起。在
我认为有三种可能性:javascript执行方法:高复杂性,需要编写大量代码,可能很脆弱
基于浏览器的东西:Selenium可能很好。我知道elinks2支持javascript,根据它的wikipedia页面,它可以用“Perl、Ruby、Lua和GNU Guile”编写脚本。在
向web管理员寻求帮助。无论如何,您都应该这样做,以了解他们对机器人的政策/态度。也许他们可以为您(和其他人)提供一个接口/API。在
我建议你多了解硒,这似乎是最简单的。在