- 博客(6)
- 资源 (4)
- 收藏
- 关注
原创 python3 提取网页数据
最近一直着魔于怎么提取网页数据,找了好多工具比如BeautifulSoup,html5lib等,功能很强大,觉得太麻烦,自己想试着用正则来提取,因为以前PHP用正则提取过没成功,而且simple_html_dom非常好用,也就没去管了,刚才试了下用正则感觉相当方便,写了几句简单的程序就可以完成一些功能了,有时间完成一个好的专门提取数据,不要什么结构树之类那么复杂的东西html = h
2010-05-28 17:26:00 3484
原创 Python之HTMLParser
"""A parser for HTML and XHTML."""# This file is based on sgmllib.py, but the API is slightly different.# XXX There should be a way to distinguish between PCDATA (parsed# character data -- the n
2010-05-26 16:03:00 5565
原创 python笔记——诡异BUG?
最近又重新装上了windows 7感觉还是那样,主要是想用M8SDK写些程序。也想在windows上玩玩,一直都觉得用C写一些常用的东东很复杂,只有借助于解释性语言了,在python, ruby间选择,最终用Python。python的语法非常简单,对于一个学过编程的人可能一上午就差不多了,不过python的强大之处在于它有N多的库可以方便我们处理问题,熟悉这些库则要花一些时间。 实际
2010-05-25 16:34:00 2702 2
原创 [转]艾宾浩斯遗忘曲线
本文转自http://www.cppblog.com/ietj/archive/2009/11/11/100708.html 学英语,词汇量的大小是决定英语水平的重要因素,下面介绍一种科学有效的单词记忆法.这个就是著名的艾宾浩斯遗忘曲线从中可以看出我们如潮水般汹涌的遗忘,从中观察时间间隔20分钟,1小时,8-9小时一天,两天,31天我们不复习会记的所学的百分之多少,对此先给一个复习
2010-05-12 10:10:00 1466
原创 Fortran
考研了,以后要学量子化学,导师说以后要用Fortran写程序,郁闷!学的第一门也是课堂上学的唯一一门语言就是Fortran了,不过现在都忘光光了,不过还好,FORTRAN语法很简单,要不了多久就可以温习完了……偶就想不通FORTRAN为什么还能流行到现在,要说随便那种语言都可以完成他能做的事了…… 今天不幸,切菜把手切了,差点没把手指给削了一节
2010-05-04 21:28:00 957 2
黑白棋(半成品)
2007-04-10
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人