python 函数
文章平均质量分 69
无限大地NLP_空木
这个作者很懒,什么都没留下…
展开
-
python——thefuzzy、difflib详解
preface:最近业务上涉及一些文本匹配计算的东西,包括以往也涉及到,用到模糊匹配,但之前并没有深究原理。这次详细看了下模糊计算的得分怎么计算的。编辑距离计算略。thefuzzy:python的模糊匹配包,java也有实现。里面基本上基于difflib来实现的。 地址:https://github.com/seatgeek/thefuzz 安装:pip install thefuzzdifflib:计算两个字符串差异的包。有主要的SequenceMatcher类。SequenceMatc原创 2022-04-17 16:50:03 · 3080 阅读 · 0 评论 -
匹配算法——相亲男女匹配
时间:20210928背景:有个相亲活动,需要暗地里给男女进行匹配,毕竟明面上直接说不喜欢哪个异性总是尴尬的。匹配的话,方法众多,并不能让每个人都满意,根据各自的意向,总能计算整体意向都不错的。太长了不看,直接操作:线下让N对男女:写个小纸条,各自给N个异性排序,更喜欢的排在前面 得到: 女生的选择:womanChoices 女1:男2,男5,男1,.... 女2:... ... 女N:... 男生的选择:manChoices 同理 操作:原创 2021-09-28 22:22:35 · 3745 阅读 · 0 评论 -
python——工作常用包合集
preface:工作中使用python进行处理常会遇到各种问题及技巧,为此汇总。python功能太多,记住常用即可。环境:python3.7及以上、macpython——pip、conda、ipython常用1:创建虚拟环境(从一个爸爸创造多个儿子,各个儿子之间环境不影响,同一个服务器上自己的python环境不被其他人干扰,自己的多个人可采用不同版本tensorflow包等等) which conda:查看当下是哪个condaconda env list:看看有哪些虚拟环境cond原创 2020-12-26 17:00:39 · 613 阅读 · 0 评论 -
python加速
Preface:许久没有更新博客了,把老夫以往整理的技术相关,再整理下。。目录一、cpython计算加速二、multiprocessing子进程加速v1三、multiprocessing子进程加速v2四、numba数值计算加速五、爬虫多线程加速一、cpython计算加速https://zhuanlan.zhihu.com/p/24168485二、multiproc...原创 2020-04-21 17:02:05 · 638 阅读 · 0 评论 -
python dict字典
当我基本能从事Django框架来对网站进行开发的时候,发现对Python的知识了解得太少了,甚至到了知识匮乏的阶段。看来,我得温习一下Python知识了。 据我个人的理解,Python中有三种内置的数据类型。dictionary(字典)、List(列表)和tuple(元组)。下面我将对这几个内置的数据类型进行总结。 Dictionary(字典) 首先,什么是字典呢?通俗转载 2014-10-15 18:11:24 · 694 阅读 · 0 评论 -
python open读写函数
1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。file_object = open('thefile.txt')try: all_the_text = file_object.read( )finally: file_object.close( )转载 2014-10-14 21:43:07 · 1577 阅读 · 0 评论 -
python encode和decode函数
字符串编码常用类型:utf-8,gb2312,cp936,gbk等。python中,我们使用decode()和encode()来进行解码和编码在python中,使用unicode类型作为编码的基础类型。即 decode encodestr ---------> unicode --------->stru = u'中文' #显示指定unicod转载 2014-10-14 21:37:40 · 1485 阅读 · 0 评论 -
python文档字符串查找应用---find()
功能:用python找出文档中某字符串出现的起始位置,结束位置。原创 2014-04-20 22:39:26 · 1461 阅读 · 0 评论 -
Python高级编程技巧
本文展示一些高级的Python设计结构和它们的使用方法。在日常工作中,你可以根据需要选择合适的数据结构,例如对快速查找性的要求、对数据一致性的要求或是对索引的要求等,同时也可以将各种数据结构合适地结合在一起,从而生成具有逻辑性并易于理解的数据模型。Python的数据结构从句法上来看非常直观,并且提供了大量的可选操作。这篇指南尝试将大部分常用的数据结构知识放到一起,并且提供对其最佳用法的探讨。推转载 2014-03-19 17:24:04 · 779 阅读 · 0 评论 -
python读取文本文档处理不可见字符
某些软件,如notepad,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。因此我们在读取时需要自己去掉这些字符,python中的codecs module定义了这个常量:# coding=gbkimport codecsdata = open("Test.txt").read()if data[:3] ==转载 2014-04-21 12:09:48 · 8173 阅读 · 0 评论 -
python time模块详解
python 的内嵌time模板翻译及说明 一、简介 time模块提供各种操作时间的函数 说明:一般有两种表示时间的方式: 第一种是时间戳的方式(相对于1970.1.1 00:00:00以秒计算的偏移量),时间戳是惟一的 第二种以数组的形式表示即(struct_time),共有九个元素,分别表示,同一个时间戳的struct_time会因为时转载 2014-10-14 21:50:13 · 778 阅读 · 0 评论 -
python decode()函数初解
python字符集,没弄懂的菜鸟怕是原创 2014-10-18 21:15:21 · 1426 阅读 · 0 评论 -
python小型函数技巧积累
preface:在前进的路上遇到的python各种小函数技巧积累。enumerate:枚举format:格式化输出。对字符串进行输出时,print加逗号可破,但当字符串变量多了起来的时候,同字符串常量放在一起,逗号就变多了。不太方便。通过format类进行格式化,将变量都放在一起,能够更加方便地控制输出格式。具体的fomat语法说明网上博客也是一大堆,如http://www.2cto.原创 2015-01-20 22:27:10 · 1208 阅读 · 0 评论 -
python 机器学习之sklearn-LR
from numpy import * from sklearn.datasets import load_iris # import datasets# load the dataset: irisiris = load_iris() samples = iris.data#print samples target = iris.target # import the转载 2015-04-15 09:46:28 · 11413 阅读 · 0 评论 -
python输入输出---read(),readline()和readlines()
我们谈到“文本处理”时,我们通常是指处理的内容。Python 将文本文件的内容读入可以操作的字符串变量非常容易。文件对象提供了三个“读”方法: .read()、.readline() 和 .readlines()。每种方法可以接受一个变量以限制每次读取的数据量,但它们通常不使用变量。 .read() 每次读取整个文件,它通常用于将文件内容放到一个字符串变量中。然而 .read() 生成文件内容最直原创 2014-04-21 14:03:22 · 2935 阅读 · 0 评论 -
python数据结构——层次遍历的两种方法
preface:主要是最近用层次遍历比较多,先中后序的遍历都有递归与非递归的方式,也比较容易明白,但层次不是很熟悉,自己不是很擅长,故记录下来。递归与非递归class TreeNode(object): def __init__(self, x): self.val = x self.left = None self.right原创 2016-03-28 14:56:28 · 3226 阅读 · 0 评论 -
Python实现各类数据结构和算法
数据结构和算法——python实现#---------------------------------------------------------------------目录START---------------------------------------------------------------------第一部分列表模块一:经典排序实现交换类排序法原创 2014-03-11 22:07:26 · 1872 阅读 · 0 评论 -
python算法——字符串表达式的计算
preface:最近有个面试,被要求给出一个字符串表达式,计算出结果。本以为是见到过的,想着用一个栈,然后被面试官打断说你这样是有问题的,然后想了说用树,又被打断说是有问题的,再仔细想想。结果还是没整出来。哎。回来翻了下leetcode发现有两道类似。leetcode 224 Basic Calculator https://leetcode.com/problems/basic-calc原创 2016-07-10 18:43:42 · 17450 阅读 · 3 评论 -
python文件读写操作---文件路径含有中文打开错误
python文件读写操作之文件路径含有中文,打开错误用Python读入文件时,若是路径包含中文,直接打开会出现错误处理:使用unicode函数,对路径进行编码,然后再打开,便可以。#coding:utf-8#对路径进行编码,不然,文件路径含有中文的话,会出现错误filepath=unicode(r'G:\baidubaike-cleared\白雪\白雪:画家.txt','utf原创 2014-04-14 10:16:50 · 4737 阅读 · 0 评论 -
Python实现各类数据结构和算法---计数排序
python实现计数排序原创 2014-04-03 23:24:47 · 1369 阅读 · 0 评论 -
Python-目录操作
注意之前要import os1.获得当前路径在Python中可以使用os.getcwd()函数获得当前的路径。其原型如下所示。os.getcwd()该函数不需要传递参数,它返回当前的目录。需要说明的是,当前目录并不是指脚本所在的目录,而是所运行脚本的目录。例如,在PythonWin中输入如下脚本。>>> import os>>> print 'current directory i原创 2014-03-13 22:35:21 · 627 阅读 · 0 评论 -
python 目录操作函数
1.mkdir( path [,mode] ) 作用:创建一个目录,可以是相对或者绝对路径,mode的默认模式是0777。 如果目录有多级,则创建最后一级。如果最后一级目录的上级目录有不存在的,则会抛出一个OSError,例如:import osos.mkdir( './image' ) # successful# if ./download exits, succe原创 2014-03-13 22:35:29 · 760 阅读 · 0 评论 -
python中xrange和range的异同
range 函数说明:range([start,] stop[, step]),根据start与stop指定的范围以及step设定的步长,生成一个序列。range示例: >>> range(5) [0, 1, 2, 3, 4] >>> range(1,5) [1, 2, 3, 4] >>> range(0,6,2)[0, 2, 4]xrange 函数说明转载 2014-03-10 14:00:02 · 738 阅读 · 0 评论 -
Python实现各类数据结构和算法---直接选择排序
不解释a=[4,2,5,3,1,8,20,31,24,35,6]print 'before insertSort',adef straightSelectSort(A): for i in xrange(0,len(A)): k=i for j in xrange(i,len(A)): if A[i]>A[j]:原创 2014-03-17 22:42:13 · 563 阅读 · 0 评论 -
Python实现各类数据结构和算法---动态规划之最长公共子序列
根据《算法导论》中动态规划一章介绍的最长公共子序列原理,python实现,原理及伪代码书籍详见p223-225 #coding:utf-8'''Created on 2014-3-19@author: admin'''def LCS_Lenth(x,y): m=len(x)+1 #数组x,y从0开始,书籍上,从1开始,故加1 n=len原创 2014-03-19 21:49:06 · 1582 阅读 · 0 评论 -
Python实现各类数据结构和算法---折半查找
递归和非递归形式实现二分查找#coding:utf-8a=[1, 2, 3, 4, 5, 6, 8, 20, 24, 31, 35]#-----------------递归二分查找------------------b=10def binarySearch(array,n,left,right): mid=left+(right-left)/2 if(left>righ原创 2014-03-13 22:24:51 · 1675 阅读 · 0 评论 -
python HTMLParser处理A标签…
HTMLParser类中有针对HTML标签的相应的函数,通过自定义,重载类中的函数来处理一些标签,函数如下:HTMLParser.anchor_bgn(href, name, type):#a标签开始的时候被调用,参数是A标签的属性值HTMLParser.anchor_end() #锚点标签结束的时候处理HTMLParser.save_bgn():#开始在缓冲区中保存字符数据,通过save原创 2014-03-13 22:35:42 · 1729 阅读 · 0 评论 -
python sorted函数使用说明
我们需要对List进行排序,Python提供了两个方法对给定的List L进行排序,方法1.用List的成员函数sort进行排序方法2.用built-in函数sorted进行排序(从2.4开始)--------------------------------sorted--------------------------------------->>> help(sorte转载 2014-03-10 13:58:59 · 1411 阅读 · 0 评论 -
python中关于时间和日期函数的常用…
原创作品,允许转载,转载时请务必以超链接形式标明文章原始出处 、作者信息和本声明。否则将追究法律责任。http://wangwei007.blog.51cto.com/68019/1102130python中关于时间和日期函数有time和datatime 1.获取当前时间的两种方法:import datetime,timenow = time.strftime("%Y-%m-%d原创 2014-03-13 22:35:57 · 863 阅读 · 0 评论 -
Python内置的字符串处理函数整理
收集常用的Python 内置的各种字符串处理 函数的使用方法str='python String function'生成字符串变量str='python String function' 字符串长度获取:len(str)例:print '%s length=%d' % (str,len(str)) 字母处理全部大写:str.upper()全部小写:str.low转载 2014-03-24 10:32:55 · 783 阅读 · 0 评论 -
python中threading模块详解(一)
threading提供了一个比thread模块更高层的API来提供线程的并发性。这些线程并发运行并共享内存。 下面来看threading模块的具体用法: 一、Thread的使用目标函数可以实例化一个Thread对象,每个Thread对象代表着一个线程,可以通过start()方法,开始运行。 这里对使用多线程并发,和不适用多线程并发做了一个比较:首先是原创 2014-03-13 22:35:52 · 1614 阅读 · 0 评论 -
python基础知识部分笔记
1、在Python 语言中,对象是通过引用传递的。在赋值时,不管这个对象是新创建的,还是一个已经存在的,都是将该对象的引用(并不是值)赋值给变量。 如:x=1 1这个整形对象被创建,然后将这个对象的引用赋值给x这个变量2、多元赋值,其实就是元组赋值x,y,z=1,2,'string' 等价于 (x,y,z)=(1,2,'string')利用多元赋值实现的两个变量的值交转载 2014-10-26 14:11:49 · 924 阅读 · 0 评论 -
Python,字典,KeyError异常
当请求字典对象里面没有的key时,python会抛出异常KeyError。如果不想抛出异常而是当没有对应的键时提供一个默认值,可以使用字典对象的get()方法:123val= adict.get('nonexist_key','default_value')print(val)#default_valueprint转载 2014-10-26 14:08:18 · 13217 阅读 · 0 评论 -
Python中的字符串
海 子 博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 :: 管理 :: 131 随笔 :: 0 文章 :: 398 评论 :: 0 引用2014年3月>转载 2014-03-24 11:03:33 · 820 阅读 · 0 评论 -
用python计算top命令中某个进程的CPU,Memory使用情况
做性能测试中经常用到top命令,监控一段时间内某个进程的CPU,memory使用情况。10秒中一次输出到文件中,以下的代码是对输出的top文件进行的处理,获取CPU利用率,memory最大,最小,平均值。#!/usr/bin/env python# -*- coding: cp936 -*-import osimport reimport stringimport argparse转载 2014-03-12 21:07:26 · 2968 阅读 · 0 评论 -
Python 文件操作函数
文件操作用内建函数:open()格式:F=open(filename,访问方式[r,w,a,b]) ## r:读操作;w:写操作;a:添加操作;b:二进制存取操作 如果缺省就是r1.并非只能访问文本文件open可以访问任何形式的文件,在访问非文本格式文件(二进制文件)的时候,访问模式通常加上‘b’(即二进制模式:‘rb’或‘wb’),但并不必须,依情况而定2.路径是填写在原创 2014-03-13 22:35:39 · 711 阅读 · 0 评论 -
Python实现各类数据结构和算法----归并排序
根据《算法导论》P17-19写的,#coding:utf-8'''Created on 2014-3-12@author: admin'''a=[4,2,5,3,1,8,20,31,24,35,6]print 'before mergeSort',a[:]#----------------归并排序--------------def mergeSort(array,p,q,r)原创 2014-03-13 22:19:51 · 709 阅读 · 0 评论