自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 资源 (3)
  • 收藏
  • 关注

原创 爬虫进阶之路(2)————核心技术

网络爬虫核心技术通用爬虫网络的实现原理聚焦网络爬虫实现原理爬行策略网页更新策略网页分析算法身份识别总结 通用爬虫网络的实现原理 (1)获取初始的URL.初始的URL地址可以由用户人为地指定,也可以由用户指定的某个或某几个初始爬取网页决定。 (2)根据初始的URL爬取页面并获得新的URL.获得初始的URL地址之后,首先需要爬取对应URL地址中的网页,爬取了到应的URL地址中的网页后,将网页存储到原...

2019-04-02 16:20:36 1163

原创 爬虫进阶之路(1)————理论基础

网络爬虫什么是网络爬虫:学习网络爬虫可以做什么网络爬虫的组成网络爬虫的分类爬虫能做什么检索和索引用户爬虫网络 什么是网络爬虫: 在大数据的背景下,我们需要网络上的金融,医学,新闻等数据进行研究时,如果人工的手段去获取这些数据的话,需要大量的时间和精力。为此网络爬虫的产生为我们解决了这些问题。网络爬虫可以自动的浏览网络中的信息,当然浏览信息的时候需要按照我们制定的规则去浏览,这些规则我们将其称为网络...

2019-04-02 10:28:29 264

原创 使用贝叶斯实现简单得拼写检查

贝叶斯实现拼写检查实现原理详细步骤导入语料库并进行处理编辑距离,P(w|a)的实现实现代码 实现原理 求解:argmaxc P(a|w)->argmaxc P(w|a)P(a)/P(w) P(a):语料库中一个词正确拼写得概率;该词在在语料库中得概率 P(w|c):用户实际想敲a却敲成w的概率;用户有多大概率会把c敲成w argmaxc :用来枚举所用的a,并且选取最大的 详细步骤 导入语料...

2019-02-07 16:38:04 681

服务器putty工具

在服务器开发中可以使用,适合阿里,腾讯,百度服务器

2017-12-11

MD5数据加严

加严工具,本人觉得很好用。多方测试有效,如需实例下次上传。

2017-12-10

数据库驱动

版本是5.14的,本人测试通过,很好用,Java开发和web开发都可以用

2017-12-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除