selenium-java 解决 jsoup遇到javascript重定向无法获取内容的问题

本文探讨了使用JSoup爬取网页时遇到JavaScript重定向问题的解决方案,介绍了如何借助Selenium和ChromeDriver绕过JS重定向,同时解决了因依赖冲突导致的运行错误,最终实现了对动态加载内容的抓取。
摘要由CSDN通过智能技术生成

问题

通过jsoup爬网站的时候,遇到javascript重定向,递归无果,查了许多资料都无法解决在这里插入代码片

返回的页面

利用selenium龟速实现,先解决问题

maven依赖

<!-- https://mvnrepository.com/artifact/org.seleniumhq.selenium/selenium-java -->
            <dependency>
                <groupId>org.seleniumhq.selenium</groupId>
                <artifactId>selenium-java</artifactId>
                <version>3.141.59</version>
            </dependency>

下载webdriver驱动,我用的是chrome
http://chromedriver.storage.googleapis.com/index.html

String url = "";
System.setProperty("webdriver.chrome.driver", "C:\\Program Files (x86)\\Google\\Chrome\\Application\\chromedriver.exe");
WebDriver driver = new ChromeDriver();
driver.get(url);

遇到坑爹的jar包冲突 java.lang.NoSuchMethodError: com.google.common.base.Preconditions.checkState(ZLjava/lang/String;Ljava/lang/Object;Ljava/lang/Object;Ljava/lang/Object;)V

这位大佬解决了我的问题
https://blog.csdn.net/qq_27948811/article/details/100047242

和我的swagger冲突了

			<dependency>
                <groupId>io.springfox</groupId>
                <artifactId>springfox-swagger2</artifactId>
                <version>2.7.0</version>
                <exclusions>
                    <exclusion>
                        <groupId>com.google.guava</groupId>
                        <artifactId>guava</artifactId>
                    </exclusion>
                </exclusions>
            </dependency>

回到Jsoup

 String pageSource = driver.getPageSource();
 Document document = Jsoup.parse(pageSource);

后面就可以继续用jsoup解决了,不过很慢,中间会弹一次浏览器,感觉很难受
如果哪位大神有好的办法可以解决javascript的重定向,欢迎交流~~~~~~~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值