我有以下html页面。我只想在C#中的第一个表格标签中提取数据。 html页面的代码是:如何从具有各种嵌套表格标签的html页面中仅提取第一个表格标签
11/09/2013 at 09:48 |
ETAShip NameFrom portTo berthAgent
11/09/2013 at 09:00 SONANGOL KALANDULA Cabinda Valero 6 Graypen更具体的我想提取其最新11/09/2013 at 09:48仅行下面提到的代码下的第一个标签,我使用正则表达式
"
但这是我得到整个页面源代码,我正在获取所有表标记之间的数据,但我只想在第一个表标记之间的文本。
谁能告诉我正则表达式,我只能从整个html页面中提取这个特定的部分?
+3
你有没有考虑过使用html解析器? –
+1
这正是正则表达式不是处理HTML输入的方式。如果你有一套有限的,已知的HTML,正则表达式可能是一个快速解决方案。但恰恰是深度未知的嵌套标签无法处理。我也会建议看一下这个HTML解析器。 –