自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

gls_liujia的专栏

追寻人生的高度

08月 07月

原创搜索引擎-信息检索实践—网络爬虫

网络爬虫有两个任务：下载页面和发现URL。从请求队列中取出URL，下载对应页面，解析页面，找到链接标签。网络爬虫发现了没有遇到过的URL，将其加入请求队列。网络爬虫使用礼貌策略(politeness policy)：网络爬虫不会在特定的网络服务器上一次抓取多个页面，在同一个网络服务器的两次请求之间，网络爬虫会等待一定时间。管理员可以在网络服务器上保存robo

2013-07-31 20:50:55 2995

原创 URL- 含义及组成

URL (uniform resource locator) : 互联网的每个网页都有自己唯一的统一资源定位器，由3部分组成：通信协议，主机名，资源名。HTTP(hypertext transfer protocol)：网页存储在网络服务器，使用超文本传输协议，和客户端软件交换信息。主机名：保存该网页的网络服务器的计算机名。资源名：该URL指向这台计算机的一个页面。举例：

2013-07-31 18:32:43 2078

抓取265.com分类及对应的网站（C# code）

抓取265.com分类体系及分类下的网站用于建立web分类体系，获取特定分类下的数据

2012-08-21

网络编程之------网络编程常用函数

其中介绍了网络编程的常用函数~~~~~~~~~~~~~~~~~~~~~~~~~~

2010-10-29

几种典型的负载均衡算法

其中介绍了负载均衡的原理及相关算法，能够帮助你快速理解负载均衡

2010-10-29

makefile相关资料

很不错的makefile相关资料，makefile探秘的ppt,教你快速入门

2010-10-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

gls_jia CSDN认证博客专家 CSDN认证企业博客

码龄14年

IP 属地：美国

IP属地以运营商信息为准，境内显示到省（区、市），境外显示到国家（地区）

48: 原创

23万+: 周排名

176万+: 总排名

10万+: 访问

: 等级

1822: 积分

117: 粉丝

89: 获赞

124: 评论

12: 收藏

私信

关注

热门文章

分类专栏

最新评论

二值分类模型的评价指标
小人物大梦想: 栈和队列的区别是啥？吃多了拉就是队列；吃多了吐就是栈。诚信互关，让我们一起互相学习吧！来自一个不屈服命运的老菜鸟！
使用lucene构建简易的全文检索系统
Leon2655: 博主您好！请问我按照您的代码运行了但是为什么都检索不到结果呀？（中文2字词汇）
二值分类模型的评价指标
gatsbybee: 如何解释召回率与准确率？ - Charles Xiao的回答 - 知乎 https://www.zhihu.com/question/19645541/answer/91694636 可以作为补充
女程序员的反思
xiyouxyh: 看评论看到迷茫了。我也是女程序员。。。刚毕业4个月。入职4个月吧有点闲了
女程序员的反思
yhqing2012: 运气好，现在这个组有一半是女的

最新文章

提示

确定要删除当前文章？

取消删除