Python
文章平均质量分 81
桂冠
不积跬步无以至千里,不积小流无以成江海
展开
-
Python学习之网页抓取(一)
这一篇实现的功能是:抓取匹配正则表达式的网址,并下载到本地 #!/usr/bin/env python # -*- coding: GBK -*- import urllib import re start_url = "http://www.baidu.com" #获取网站内所有链接 def get_url(url): html = urllib.ur原创 2013-07-22 17:47:32 · 681 阅读 · 0 评论 -
Python抓取数据并存入到mysql
#!/usr/bin/env python #coding:utf-8 ''' Created on Jul 21, 2013 @author: belong ''' import urllib import re import datetime import MySQLdb import time start_url = "https://xively.com/原创 2013-07-22 17:26:41 · 5185 阅读 · 0 评论 -
Python学习之网页抓取(二)
这一篇实现的功能是:对下载的网页内容进一步提取内容,如网页编码类型,标题等。 #!/usr/bin/env python # -*- coding: GBK -*- ''' Created on Jul 17, 2013 @author: belong ''' import urllib import re class Tools: def write_l原创 2013-07-22 17:52:18 · 666 阅读 · 0 评论