- 博客(4)
- 资源 (10)
- 收藏
- 关注
原创 关于爬虫Demo的一点补充
上一篇简单的Demo确实实现了一些爬虫的功能。但是距真正的搜索引擎爬虫确实想去甚远。 1.首先下载URL时,大多是维护一个DNS服务器,找到相应的IP在进行下载网页。 2.维护URL队列时,上篇程序属于纵向的深度遍历,所以维护队列会越来越大,这算是比较大的bug了。解决方法起线程,或者每个页面只抓取一个URL。 3,关于URL抓取和种子URL写的也比较简陋,好吧,原谅他只是个Demo。urll
2015-04-29 20:41:43 526
原创 Python第一个程序小爬虫
最近想上手Python。快速入门一门语言的方法就是写个小Demo。Python Demo必须是爬虫了。第一个小爬虫程序有些简陋,高手勿喷。关于爬虫主要分为三个部分:根据队列中的URL爬取界面、获取内容、保存结果。程序是以百度网站大全为种子URL,抓取页面中URL依次放入队列中,爬虫从URL队列依次取得新URL继续向外爬取。# -*- coding: utf-8 -*-import urllib2
2015-04-29 20:11:09 829
原创 Windows Server 2013 域—Active Directory 用户和计算机
ActiveDirectory 用户和计算机为执行日常Active Directory 管理任务的管理工具。这些任务包括创建、删除、修改、移动和设置存储在目录中的对象的权限。这些对象包括组织单位、用户、联系人、组、计算机、打印机和共享的文件对象。Organization Unit (OU)OU即组织单元。一个组织单元OU是把对象组织成逻辑管理组的容器,其中包
2015-04-02 20:28:04 1840
原创 Windows Server 2013 域—主机加域
这篇主要讲主机如何加域,本篇可能比较小白,但是思前想后还是认为有必要把加域放在单独一篇里。首先要配置主机的IP地址和DNS。DNS服务器对域来说是不可或缺的,一方面,域中的计算机使用DNS域名,DNS需要为域中的计算机提供域名解析服务;另外一个重要的原因是域中的计算机需要利用DNS提供的SRV记录来定位域控制器,因此我们在创建域之前需要先做好DNS的准备工作。然后右键计算机选择属性。点击更
2015-04-01 15:29:16 925
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人