.NET 分布式爬虫框架

数字智慧化基地

于 2024-06-08 07:30:00 发布

阅读量854

点赞数 3

分类专栏： .NET/C#中大型项目开发文章标签： .net 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/alan200995/article/details/139401531

版权

.NET/C#中大型项目开发专栏收录该内容

38 篇文章 1 订阅 ¥259.90 ¥399.90

订阅专栏

超级会员免费看

🏆作者：科技、互联网行业优质创作者
🏆专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造
🏆欢迎关注我（Net数字智慧化基地），里面有很多高价值技术文章，是你刻苦努力也积累不到的经验，能助你快速成长。升职+涨薪！！

RuiJi.Net

RuiJi.Net 是一个可以分布式部署的爬虫框架，使用 C# 开发，项目的最终目的是可以对大量的网站进行自动更新检查及抓取。

RuiJi.Net 支持自管理Cookie,并且自动维护不同浏览器标识的Cookie，这意味着您可以在使用独立IP的基础上，虚拟出任意多的Cookie. RuiJi.Net 同样支持使用抓取服务器上的IP进行轮询抓取，并且也可以使用代理服务器。

RuiJi.Net具有自己的抽取模型，称为RuiJi Expression（RuiJi表达式），您可以使用RuiJi表达式定义抽取模型，并对需要提取的元数据进行精确清洗。

RuiJi 表达式可以存储为文本文档、数据库及高速缓存中。

如何使用

使用本地 IP

var crawler = new RuiJiCrawler();
var request = new Request("https://www.baidu.

了解本专栏

超级会员免费看

数字智慧化基地

关注

3
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
.NET 分布式爬虫框架

🏆作者：科技、互联网行业优质创作者🏆专注领域：.Net技术、软件架构、人工智能、数字化转型、DeveloperSharp、微服务、工业互联网、智能制造🏆欢迎关注我（），里面有很多技术文章，，能助你快速成长。升职+涨薪！！RuiJi.Net 是一个可以分布式部署的爬虫框架，使用 C# 开发，项目的最终目的是可以对大量的网站进行自动更新检查及抓取。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。