go-rod 是基于 chrome devtools 协议的又一款 golang 驱动库。
目前 github 1.8k 个星星,比同行高出太多。
说一下使用经验:
要不要用Must*方法?
我觉得是不要用,比如:
func doSth() {
el0 := page.MustElementX("//div")
...
el1 := page.MustElementX("//div")
...
el2 := page.MustElementX("//div")
}
err = rod.Try(func () {
doSth()
})
if err != nil {
seelog.Errorf("doSth failed: %v", err);
}
如果你调用了 doSth()
方法,假设其中一个 MustElementX 出错了,比如超时,那你得到的错误信息仅仅是:
doSth failed: context deadline exceeded
你永远不知道哪一步出错,只能每一步之前加个 debug log。
所以我通常都是用 ElementX :
func doSth() {
el0, err := page.ElementX("//div")
if err != nil {
seelog.Errorf("find el0 failed: %v", err)
}
...
el1, err := page.ElementX("//div")
if err != nil {
seelog.Errorf("find el1 failed: %v", err)
}
...
el2, err := page.ElementX("//div")
if err != nil {
seelog.Errorf("find el2 failed: %v", err)
}
}
看起来繁琐,但出错就会很容易调试。
如何避免卡住?
经常遇到这样的情况,页面加载出一部分,某个元素找不到、看不到、点不到,就会一直停在那里。
所以我的解决办法是加 Timeout:
el, err := page.Timeout(timeout).ElementX("//div")
err := el.Timeout(timeout).Click(proto.InputMouseButtonLeft)
找到父元素后,如何查找/搜索它的子元素?
假设父元素 (FORM) 完整路径是:/html/body/form
子元素 (INPUT) 完整路径是: /html/body/form/div/input
parent, err := page.ElementX("//form")
inputEl, err := parent.ElementX("*//input")