自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (11)
  • 收藏
  • 关注

原创 python学习笔记,整形,字符串

字符串转换成整形import stringa="12345"#转换成intstring.atoi(a)#也可以,不用区分int和long。int(a)#不过如果你的数字太长 还是转换成 longstring.atol()二进制、十六进制与十进制之间的转换def Binary2Decimal(bin_num):    """ Return the decimal representation o

2008-08-31 15:27:00 4141

原创 Avoid URLs Matching Any of a Set of Patterns(chilkat/python学习四)过滤url

 大家都知道在页面的超链接中可以连接很多东西,有用的,非常有用的,或是无聊的,无用的,甚至还有错误的,空的,还有莫名其妙的;做个爬虫是很幸苦的,老是被href欺骗感情,遇到这么些个东西你该怎么办呢,过滤掉他,一脚把他踢得远远的,爬虫我的感情是很丰富,但是绝对不喜欢滥交的;代码:spider = chilkat.CkSpider()#  The spider object crawls a sing

2008-08-23 22:05:00 1009

原创 Fetch robots.txt for a Site(chilkat/python 学习三)寻找robots.txt

这个学习内容还算有点意思,了解爬虫的人应该都知道robots.txt;他的作用我就不说了。chilkat提供了一个函数来找robots.txt,现在让我们来看看他的工作吧,我找了url1 = "www.google.cn"url2 = "www.baidu.com"url3 = "www.sina.com.cn"url4 = "www.sohu.com"url5 = "www.tom.com"列表

2008-08-23 21:46:00 1268

原创 Extract HTML Title, Description, Keywords(Chilkat/Python学习二 )

 既然自己要学习Chilkat,那就接着写他的东西吧;好了,开始吧!首先你要学习这篇内容你必须了解python语法,python很简单,但是做的事不简单,这也是我学习他的原因;还有你必学安装Chilkat,具体细节去看我的 Getting Started Spidering a Site使用Chilkat(python)练习的一个爬虫(from :http://www.example-code.c

2008-08-23 21:08:00 1922

原创 Getting Started Spidering a Site使用Chilkat(python)练习的一个爬虫(from :http://www.example-code.com)

英文原文地址:http://www.example-code.com/python/spider_begin.asp一、下载:上面页面中的 Download Chilkat Python Library(Chilkat :翻译出来的意思是奇尔卡特人(北美阿拉斯加印第安部落特林基特人的分支),老美还是蛮有意思的,啥时候咱们中国人做的软件也起一个叫啥“纳西”或是“蒙古”库的软件;那样是不是感觉很coo

2008-08-23 19:30:00 3600

Image2Lcd.zip

Image2LCD is used to convert an image to color lcd format. The program will allow you to convert one image at a time or you can use batch conversion to convert multiple files at once such as bin,bmp,wbmp,robj.You have the option of converting into a monochrome, 4 color and so on up to 32-bit TrueCol

2020-08-21

Mac_OSX_VCP_Driver.zip

CP210x USB to UART Bridge VCP Drivers CP210x串口驱动程序,直接使用串口终端工具,设定相应的串口,使用115200波特率就可以连接EPS32了。[mac版本]

2020-08-12

c-a-s-i-a汉语情感-语料库

汉语情感-语料库

2017-07-23

MySQL-python-1.2.2.win32-py2.6

MySQL-python 驱动 MySQL-python-1.2.2.win32-py2.6.exe

2012-12-05

expect4j-1.0.jar

expect4j jar

2012-03-02

TailW-0.2.1.exe

可以tail形式在windows下动态查看日志的输出

2011-12-15

Windows上安装Hadoop文档

hadoop 安装 分布式 hbase

2011-12-12

nosql生态系统 pdf文档

nosql生态系统 pdf文档 bigtable, key/value, cap

2011-08-10

xslt Dom Sax Xpath 的帮助全书 (微软的帮助文档,英文)

xslt Dom Sax Xpath 的帮助全书 (微软的帮助文档,英文) 本人和xml打交道好多年了,这个帮助文档是我最喜欢的

2009-09-04

fpgrowth的java实现

fpgrowth的java实现,代码绝对没有问题,可以执行,而且有非常详细的注释,非本人实现的代码,如果有问题可以与作者联系,里面有作者的mail,(国人,不是老外)

2009-03-20

Nutch入门学习 pdf(作者:李阳)

Nutch入门学习 pdf(作者:李阳),是我看过的比较系统的Nutch入门学习

2009-01-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除