因此,由于受到约束,我需要使用excel vba解析一些丑陋的html。 HTML的问题在于它没有元素ID。我有一个拥有许多无标签表格的页面,每个表格都有几行。我可以建立的唯一的事情是,我需要在其中一个单元中存在标识符。每当ID“xtu_id”作为表格的一行中的单元格中的值出现时,我想要从该行中提取数据。所以它看起来像这样:使用excel vba解析HTML的错误
col1
col2
xtu_id
col4
现在,我看到xtu_id此行存在,我想该行的所有单元格转储到一个Excel工作表。以下是我从阅读其他职位计算器使用:
Sub CommandButton1_Click()
Dim appIE As InternetExplorerMedium
Set appIE = New InternetExplorerMedium
With appIE
.Navigate "https://my_website"
.Visible = True
End With
Do While appIE.Busy Or appIE.ReadyState <> 4
DoEvents
Loop
Set mydata = appIE.Document.getElementsByTagName("tr")
For Each e In mydata
For Each c In e
If c.Cells().innerText Like "xtu_id" Then
myValue = c.Cells().innerText
MsgBox (myValue)
End If
Next c
Next e
Set appIE = Nothing
End Sub
此代码的工作,直到我到了[每个...]声明,我有麻烦的每一行的每个单元循环来搜索“ xtu_id“文本。任何想法如何做到这一点?
2017-04-17
barker