python
heihuifeng
这个作者很懒,什么都没留下…
展开
-
subprocess.popen.kill杀死所有子进程
使用subprocess模块可创建子进程。subprocess.Popen(args, bufsize=0, executable=None, stdin=None, stdout=None, stderr=None, preexec_fn=None, close_fds=False, shell=False, cwd=None, env=N原创 2011-06-14 11:58:00 · 23628 阅读 · 2 评论 -
sqlite3.OperationalError: unrecognized token: ":"
在sqlite3插入数据表时,出现的错误:sqlite3.OperationalError: unrecognized token: ":" 解决方法: 插入的字符串需加引号conn.execute("insert into %s values(%d, %s, )" % (table_name, i, url)) 原因:conn.execu原创 2011-06-22 17:14:00 · 37519 阅读 · 4 评论 -
递归函数
我算是比较笨吧,今天写一个递归函数,弄了半天,才写出来。 string.py模块中没有这样的函数,得到一个字符在字符串中从右边数,出现第几次位置的前面的字符。例如:查找url中http://ie.microsoft.com/testdrive/Views/SiteMap/Default.html,从右边数出现第3次/的前面的字符串。最终得到:http://ie.microsof原创 2011-06-22 17:26:00 · 579 阅读 · 0 评论 -
sqlite3的sqlite3.connect(":memory:")
conn=sqlite3.connect(urls.db) conn=sqlite3.connect(":memory:") 有两种方式,但是后面一种只存在在内存中,对于频繁访问的话比较快。有没有什么方法折衷一下,就是conn=sqlite3.connect(":memory:")使用完之后,再保存在本地呢?原创 2011-06-22 17:29:00 · 12229 阅读 · 3 评论 -
python获取所有链接保存到数据表并依次打开
python获取网页上所有链接,并保存到sqlite3数据表中,并用浏览器打开。如果该表已存在,则直接从表中读取链接并打开。表名中去掉开头"http://", 结尾"/", 端口号,替换中间字符".", "/"为"_" 用到的python库:sgmllib,urllib网页有关re正则表达式sqlite3数据表subprocess子进程 #!/usr原创 2011-06-29 09:51:00 · 3940 阅读 · 0 评论 -
安装python-lxml
解析xml/html使用库python-lxml安装:libxml2-dev , libxslt-dev, python-lxmlhttp://lxml.de/parsing.html#parsing-html原创 2011-07-15 16:58:42 · 1026 阅读 · 0 评论 -
python 抓网站
前段时间写的,不过也参考了网上的例子,针对具体的情况做了修改。#-*- coding: utf-8 -*-import socketimport lxml.htmlimport lxml.etree# import chardetimpor原创 2011-08-16 17:22:41 · 1006 阅读 · 0 评论 -
修改Firefox的User-Agent,伪装修改秘籍
火狐浏览器修改userAgent的办法一:在火狐浏览器地址栏输入“about:config”,按下回车进入设置菜单。找到“general.useragent.override”,如果没有这一项,则点右键“新建”->“字符串”,输入这个字符串。将其值设为自己想要的UserAgent(下面附有常见UA)火狐浏览器修改userAgent的办法二:user Agent Switch转载 2012-01-16 14:32:07 · 78591 阅读 · 0 评论