关闭

selenium模拟刷百度流量源码

331人阅读 评论(0) 收藏 举报
代理可以网上找免费代理, 要是自己有代理池, 那么可以直接上自己的代理, 直接上代码


public class Spider6 {


        public static void main(String[] args) {

                GetFromXici proxys = new GetFromXici("");
                List<ProxyModel> m = proxys.getProxys();
                for (int i = 0; i < m.size(); i++) {
                        System.setProperty("http.proxyHost", m.get(i).getIp());
                        System.setProperty("http.proxyPort", String.valueOf(m.get(i).getPort()));
                        System.setProperty("webdriver.chrome.driver", "/Users/lengon/Downloads/spider/chromedriver"); //driver的目录位置。 需要自己修改。。。
                        ChromeDriverService c = new ChromeDriverService.Builder().usingDriverExecutable(new File("/Users/lengon/Downloads/spider/chromedriver")).usingAnyFreePort().build();//driver的目录位置。 需要自己修改。。。

                        WebDriver d = new ChromeDriver(c);
                        d.manage().timeouts().setScriptTimeout(30, TimeUnit.SECONDS);
                        d.get("https://www.baidu.com/s?ie=utf-8&f=8&rsv_bp=1&rsv_idx=1&tn=baidu&wd=%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB%E8%AE%BA%E5%9D%9B%20%E5%AD%A6%E4%B9%A0%E4%BA%A4%E6%B5%81&oq=%E7%BD%91%E7%BB%9C%E7%88%AC%E8%99%AB%E8%AE%BA%E5%9D%9B%20%E5%AD%A6%E4%B9%A0&rsv_pq=e1cf15500002faab&rsv_t=4f207JX9fAgXWWEiYtfmeiAB5kicgFgtQ020WtrU28nZsNJ%2BHguf37nfjws&rsv_enter=0&inputT=1343&rsv_sug3=86&rsv_sug1=38&rsv_sug2=0&rsv_sug4=2255&rsv_sug=1"); //如果是其他的关键字, 那么需要自己注意修改里面的关键字。
                        WebElement search = d.findElement(By.xpath("//*[@id=\"1\"]/h3/a")); //第几页的第几条的点击事件, 要计算好, 然后可能每天会变化, 这边可以通过关键字去定位。 这边就不提了。
                        search.click();
                        String returnMsg = d.getPageSource();
                        System.out.println(returnMsg);
                        d.close();
                        d.quit();
                }
        }
}

0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:3980次
    • 积分:55
    • 等级:
    • 排名:千里之外
    • 原创:1篇
    • 转载:2篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档