ATCO[这里,只是顺手插曲]

KEEP住个势,努力!

排序:
默认
按更新时间
按访问量
RSS订阅

如何识别高级的验证码

一、验证码的基本知识 1. 验证码的主要目的是强制人机交互来抵御机器自动化攻击的。 2. 大部分的验证码设计者并不得要领,不了解图像处理,机器视觉,模式识别,人工智能 的基本概念。 3. 利用验证码,可以发财,当然要犯罪:比如招商银行密码只有6位,验证...

2018-04-20 15:15:06

阅读数 125

评论数 0

网页分类技术介绍

1.    技术背景   分类问题是人类所面临的一个非常重要且具有普遍意义的问题。将事物正确的分类,有助于人们认识世界,使杂乱无章的现实世界变得有条理。自动文本分类就是对大量的自然语言文本按照一定的主题类别进行自动分类,它是自然语言处理的一个十分重要的问题。文本分类主要应用于信息检索,机器翻译,...

2013-08-06 11:44:08

阅读数 750

评论数 0

构建一个高性能的网页抓取器

互联网的发展,使人类提前进入了信息爆炸的年代,在浩瀚无边的信息海洋里,如何快速、准确找到对自己有用的信息,就成了一个很有价值的研究课题,于是,搜索引擎应运而生。现在,国内外大大小小的搜索引擎有很多,搜搜也是这搜索引擎大军中的一员悍将。笔者有幸参与了搜搜研发过程中的一些工作,在这里写一些自己的理解与...

2013-08-06 11:26:03

阅读数 665

评论数 0

spider技术综述

Spider系统是搜索引擎当中进行互联网上数据采集的一个核心子系统。在这个子系统当中,通常先种入一批种子Url,Spider对这些种子Url采集之后将链接提取入库,然后再对新入库的Url进行采集,并且负责对采集过的Url进行更新采集,如此循环。       随着各种垂直搜索引擎的不断发展,整个...

2013-08-06 11:03:31

阅读数 532

评论数 0

HTTP 返回状态值

一些常见的状态码为:   200 - 服务器成功返回网页   404 - 请求的网页不存在   503 - 服务器超时   下面提供 HTTP 状态码的完整列表。点击链接可了解详情。您也可以访问 HTTP 状态码上的 W3C 页获取更多信息。   1xx(临时响应)   表示临时响应并...

2013-05-24 10:08:31

阅读数 515

评论数 0

提示
确定要删除当前文章?
取消 删除