C#爬虫——前言
一、个人简介
- 小二上班第一天,头脑一发热就想学点技术,并且工作需要所以进行C#由浅入深进行学习,期待大家跟我一齐共同进步!
- 本小二,大学四年就读于一所二本院校,专业为计算机科学与技术专业,大学能够成功混到毕业证是我的荣幸,代码质量不高,希望各位CSDN大佬轻锤。
- 先跟大家聊聊我跟爬虫的渊源,大二跟老师学习Python语言,并逐渐深入学习,往机器学习和神经网络学习方向进发,在学习过程中,成功对数据的处理分析由“一点懵懂”转变到“什么也不懂”阶段。在学习机器学习过程中,某些时候也避免不了数据集的采集,所以当时为了能够获取到自己想要的简单数据,进而也学习到了一点Python爬虫的皮毛,毕业后机缘巧合之下,也让我更加坚定地准备往数据挖掘分析方向走下去。
二、爬虫简介
爬虫简易而言,就是获取数据的某种脚本或程序。爬虫都是按“发送请求——获得页面——解析页面——抽取并储存内容”这样的流程来进行,这其实也是模拟了我们使用浏览器获取网页信息的过程。
根据使用场景,网络爬虫可分为通用爬虫和 聚焦爬虫 两种。
通用网络爬虫:捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。
聚焦爬虫:"面向特定主题需求"的一种网络爬虫程序,它与通用搜索引擎爬虫的区别在于: 聚焦爬虫在实施网页抓取时会对内容进行处理筛选,尽量保证只抓取与需求相关的网页信息。
参考大佬文献:https://www.cnblogs.com/luchun666/p/9394149.html
三、C#学习爬虫的前期工作
- 了解C#这门语言能够为我们带来什么?
- C#这门语言与java语言相差不是太大,此时便需要分清相差在哪,有哪些需要注意的地方,这样对C#以后的学习会有更加深入的理解。
- 想提升代码专业技术能力,那就少不了疯狂肝代码了,选择一个熟悉友善的开发编译环境和编译器更是业务能力提升的第一步。小二在这里用的是visual studio 2019,安装教程之后再发一期水文(C#爬虫基础1),肚子墨水不够,以后只能靠水文过日子了。
- 抓包工具fiddler,安装教程下期。
- MySQL数据库和Navicat数据库管理工具。