- 博客(5)
- 资源 (5)
- 收藏
- 关注
原创 [Python]linux自定义Python脚本命令
在window下写好的程序配置到Linux上,要实现任意目录下的命令调用。由于初学Linux,这里从文件传输等最基本的方法入手,记录配置的过程中遇到的各种问题。
2014-05-22 17:57:19 3297
原创 [Python]处理压缩文件
这里讨论Python处理如下五种文件:gz tar tgz zip rargz: 即gzip,通常只能压缩一个文件。于tar结合起来就可以实现先打包,再压缩。tar: linux系统下的打包工具,只打包,不压缩tgz:即tar.gz。先用tar打包,然后再用gz压缩得到的文件zip: 不同于gzip,虽然使用相似的算法,可以打包压缩多个文件,不过分别压缩文件,压缩率低于tar。rar:打包压缩文件,最初用于DOS,基于window操作系统。压缩率比zip高,但速度慢,随机访问的速度也慢。关于z
2014-05-22 16:27:23 13001 1
原创 [Python]BeautifulSoup—HTML解析包
在用Python写爬虫时,一个常见的操作是对抓下的HTML做分析处理,得到想要的内容。一般的方法为使用Python的re库中,用正则表达式来解析文本。不过这种方法适用于所有的文本,而针对于特定格式的文本,如这里的HTML,BeautifulSoup更具有针对性,使用起来也更方便。BeautifulSoup可以解析HTML,XML等文件,这里只说明其解析HTML的功能。 Beautifu
2014-05-19 14:07:44 3314
原创 [Python]南邮OJ代码备份爬虫
之前看过Python学习的经验,说以工程为导向学习。自己分析了一下,一般接触Python的都有一定的其他语言基础,对于程序设计的基本逻辑,语法都有一个大概的了解。而Python这种脚本语言,没有过于独特的语法,在一定的其他语言的基础上,更是可以直接上手的。之前看Python简明教程,半天没有进度。正好遇上Python爬虫项目,直接上手,方便快捷。 网站:http://acm.njupt.edu.cn/welcome.do?method=index,正值系统更新,于是写一个备份代码的爬虫。
2014-05-17 20:29:45 1821
CLBP人脸识别程序及运行结果
2013-07-14
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人