用C#编写自动抓取网页数据

最新推荐文章于 2024-06-11 17:18:54 发布

gukehui2012

最新推荐文章于 2024-06-11 17:18:54 发布

阅读量9.9k

点赞数

文章标签： HtmlAgilityPack

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/gukehui2012/article/details/73010927

版权

我们每天业务需从上一级的系统中（B/S)中获取任务，上一级系统升级，没有及时提供数据包下载，而任务量又大，和上一级沟通又是被一拖再拖，没办法只能是录入人员登录上级系统，然后原始的拷贝粘贴，效率，速度太慢，在这种情况下只能自己做个抓取小软件（见下图所示）了。

经过对比，系统中引用了HtmlAgilityPack 这个组件，简单记录一下使用

经过获取html源码以后读取<input type="hidden" name="appnum" value="20170000001">

注意利用此组件读取html源码时候，双引号会使用转义字符 " ，为使得内容一致，导入到数据库或显示时必须转为双引号

public static String GetHtmlNodeValueByElementName(String html, String nodename)
{

HtmlDocument htmlDoc = new HtmlDocument();
htmlDoc.LoadHtml(@html);
string selectnodename = "";
selectnodename = string.Format("//input[@name='{0}']", nodename);
HtmlNode htmlNode= htmlDoc.DocumentNode.SelectSingleNode(selectnodename);
if (htmlNode != null)
{
return htmlNode.Attributes["value"].Value;
}
else {
return "";
}

}

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
用C#编写自动抓取网页数据

我们每天业务需从上一级的系统中（B/S)中获取任务，上一级系统升级，没有及时提供数据包下载，而任务量又大，和上一级沟通又是被一拖再拖，没办法只能是录入人员登录上级系统，然后原始的拷贝粘贴，效率，速度太慢，在这种情况下只能自己做个抓取小软件了。经过对比，系统中引用了HtmlAgilityPack 这个组件，简单记录一下使用经过获取html源码以后读取 p
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。