- 博客(9)
- 收藏
- 关注
原创 查询一个文件里面的内容是否出现在另一个文件里
import osimport sysclass Diff: def __init__(self): pass def run(self, url_file, template_file): f_template = open(template_file, 'r') f_tem = f_template.readlines(
2013-09-27 14:55:59 1040 1
原创 生成verify文件
#encoding:utf-8import osimport sysimport urllib2def regex_content(content): ###content="小燕<哈否\\住宅+在哪里|---*" #print content #print len(content) regexs=['\\','','^','$','*','+','?','{','
2013-09-23 14:04:12 674
原创 BeautifulSoup入门代码
import bs4from bs4 import BeautifulSoupimport reimport sysimport osimport chardetimport urllib2line='http://so.zhulang.com/search.php?k=%E9%BB%91%E9%81%93&t=zh&allmatch=1'headers = {'User-Ag
2013-09-23 10:31:25 766
转载 vim中删除技巧
:%s/[Ctrl-v][Enter]//g 删除DOS方式的回车^M:%s= *$== 删除行尾空白:%!sort -u 删除重复行:%s/^.{-}pdf/new.pdf/ 只是删除第一个pdf:%s/// 删除多行注释:g/^$/d 删除所有空行 :g!/^dd/d 删除不含字符串'dd'的行:v/^dd/d 删除不含字符串'dd'的行:g/str1/,/
2013-09-22 15:59:14 636
转载 正则表达式
引言 正则表达式(regular expression)就是用一个“字符串”来描述一个特征,然后去验证另一个“字符串”是否符合这个特征。比如 表达式“ab+” 描述的特征是“一个 'a' 和 任意个 'b' ”,那么 'ab', 'abb', 'abbbbbbbbbb' 都符合这个特征。 正则表达式可以用来:(1)验证字符串是否符合指定特征,比如验证是否是合法的邮件地址
2013-09-18 11:32:15 420
转载 python-Levenshtein几个计算字串相似度的函数解析
重点介绍几个该包中的几个计算字串相似度的几个函数实现。1. Levenshtein.hamming(str1, str2)计算汉明距离。要求str1和str2必须长度一致。是描述两个等长字串之间对应位置上不同字符的个数。如2. Levenshtein.distance(str1, str2)计算编辑距离(也成Levenshtein距离)。是描述由一个字串转化
2013-09-18 10:59:43 1449
原创 python 匿名函数lambda
来源地址:http://www.secnetix.de/olli/Python/lambda_functions.hawk
2013-09-16 19:06:04 452
原创 最短编辑距离
def min_edit_dis(self, s1, s2): dis = [ [ 0 for i in range(len(s2) + 1) ] for j in range(len(s1) + 1) ] for i in range(1, len(s1) + 1): dis[i][0] = i for j in range
2013-09-13 19:44:18 531
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人