.NET DotnetSpider--WebDrvierSpider(ajax动态加载的数据获取)

   爬虫获取数据时,可能会遇到AJAX加载的页面,如果无法分析出接口的话,就只能使用秘密武器——WebDriverDownloader。不过最好还是分析出接口为好,WebDriver的性能实在是太低了。

            #region WebDriverDownloader
            var option = new Option();
            option.LoadImage = false;
            option.LoadFlashPlayer = false;
            option.AlwaysLoadNoFocusLibrary = false;
            option.Headless = true;
            IWebDriverAction webDriverAction = new Click();//webDriver事件
            List<IWebDriverAction> webDriverActions = new List<IWebDriverAction>();//webDriver事件链表
            webDriverActions.Add(webDriverAction);//add webDriver事件
            var downloader = new WebDriverDownloader(Browser.Chrome, 5000, option);
            downloader.Actions = webDriverActions;//绑定到浏览器,等其执行完成load后执行
            spider.Downloader = downloader;
            #endregion

 

    /// <summary>
    /// 点击操作的实现
    /// </summary>
    public class Click : IWebDriverAction
    {
        /// <summary>
        /// 滚动次数
        /// </summary>
        public int ClickTimes { get; set; } = 1;

        /// <summary>
        /// 点击操作的具体实现
        /// </summary>
        /// <param name="webDriver">WebDriver</param>
        /// <returns>是否操作成功</returns>
        public bool Invoke(RemoteWebDriver webDriver)
        {
            try
            {
                //webDriver.Manage().Window.Maximize();
                for (var i = 0; i < ClickTimes; i++)
                {
                    Thread.Sleep(2000);
                    string sJavascriptCode = "window.open("https://www.baidu.com/");";
                    webDriver.ExecuteScript(sJavascriptCode);
                    Thread.Sleep(1000);
                }
            }
            catch (Exception)
            {
                return false;
            }
            return true;
        }
    }

 

转载于:https://www.cnblogs.com/TTonly/p/10346236.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值