python
文章平均质量分 50
小杨算法屋
这个作者很懒,什么都没留下…
展开
-
斐波那契数-leetcode509-动态规划
1、题目斐波那契数,通常用F(n)表示,形成的序列称为 斐波那契数列 。该数列由0和1开始,后面的每一项数字都是前面两项数字的和。也就是:F(0) = 0,F(1)= 1F(n) = F(n - 1) + F(n - 2),其中n > 1给你n,请计算F(n)。示例1:输入:2输出:1解释:F(2) = F(1) + F(0) = 1 + 0 = 1示例2:输入:3输出:2解释:F(3) = F(2) + F(1) = 1 +...原创 2021-09-12 22:40:29 · 120 阅读 · 0 评论 -
两数之和-leetcode第一题
题目:给定一个整数数组nums和一个目标值target,请你在该数组中找出和为目标值的那两个整数,并返回他们的数组下标。你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。示例:给定nums = [2, 7, 11, 15], target = 9因为nums[0] + nums[1] = 2 + 7 = 9所以返回[0, 1]题解:方法一:暴力法class Solution: def twoSum(self, nums: Li...原创 2021-09-12 13:01:31 · 222 阅读 · 0 评论 -
验证二叉搜索树
给定一个二叉树,判断其是否是一个有效的二叉搜索树。假设一个二叉搜索树具有如下特征:节点的左子树只包含小于当前节点的数。节点的右子树只包含大于当前节点的数。所有左子树和右子树自身必须也是二叉搜索树。示例 1:输入: 2 / \ 1 3输出: true示例 2:输入: 5 / \ 1 4 / \ 3 6输出: false解释: 输入为: [5,1,4,null,null,3,6]。...原创 2021-05-10 14:43:05 · 118 阅读 · 0 评论 -
leetcode高频题目汇总
最近将本人刷的高频题进行了总结,汇总了word,主要目录包括以下内容:1、数组 1.1 子集 1.2 两数之和 1.3 和为K的子数组 1.3-1 和可被 K 整除的子数组 1.4 删除排序数组中的重复项 1.5 反转字符串 1.6 反转字符串中的单词 III 1.7 合并两个有序数组 1.8 最接近的三数之和 1.9 最长公共前缀 1.10 数组中重复的数字 1.10-1 287. 寻找重复数-快慢指针 1.11 和为s的两个数字 1.12 乘积原创 2021-04-30 15:51:39 · 602 阅读 · 2 评论 -
python-docx生成docx文件
python-docx是python编程语言的一个库,可以对docx文档进行读,同时也可以进行生成docx文档,这篇文档主要是讲生成docx文档。1、生成一个空docx文档# coding:utf-8from docx import Documentdocument = Document()document.save('1.docx')2、往docx文档中添加内容,并设置文字...原创 2020-03-27 10:01:45 · 3481 阅读 · 2 评论 -
leetcode面试刷题
88、找不同给定两个字符串 s 和 t,它们只包含小写字母。字符串t由字符串s随机重排,然后在随机位置添加一个字母。请找出在 t 中被添加的字母。示例:输入:s = "abcd"t = "abcde"输出:e解释:'e' 是那个被添加的字母。代码:class Solution: def findTheDifference(s...原创 2020-01-10 13:15:34 · 1212 阅读 · 3 评论 -
gensim中doc2vec计算文本相似度
最近在做判断两个文本是否是描述的同一件事情,之前是采用gensim中的TF-IDF进行计算的,TF-IDF这种方法没有考虑到文字背后的语义关联,可能在两个文档共同出现的单词很少甚至没有相同的单词,但两个文档是相似的情况下,就需要考虑到文档的语义。我们都知道word2vec是可以分析语义的,那么doc2vec是不是也可以分析出语义呢?于是试了一下gensim中的doc2vec。Doc2Vec也...原创 2018-09-06 17:14:20 · 12749 阅读 · 1 评论 -
replace函数在python2中编码格式的转换
在python2版本中处理字符串时,经常能遇到的问题就是编码格式问题,一不小心就会遇到问题今天偶然间发现replace()函数可以将字符串的编码格式进行更改,具体的代码如下所示:>>> a = 'hello a'>>> print type(a)<type 'str'>>>> b = u'hello b'>&...原创 2018-09-12 16:19:58 · 1524 阅读 · 0 评论 -
数据脱敏python
最近在对数据做脱敏的事情,第一次接触这方面的,所以将自己的做法记录了下来,希望对大家有所帮助,仅是自己的一点拙见。1、数据脱敏定义数据脱敏(Data Masking),又称数据混淆、数据漂白、数据去隐私化。是一种为用户提供虚假数据而非真实数据、防止敏感数据滥用的技术,包括静态脱敏(通常在非生产数据库中防止静态数据的滥用)和动态脱敏(生产数据库中传输数据的脱敏)2、任务描述相关单位在...原创 2018-11-23 11:49:59 · 7767 阅读 · 4 评论 -
哈工大LTP本地安装及python调用
LTP即哈工大语言技术平台云,是基于云计算技术的中文自然语言处理服务平台在线使用的网址:https://www.ltp-cloud.com/github网址:https://github.com/HIT-SCIR/ltp模型下载网址:http://ltp.ai/download.html1、安装我主要完成了python安装pyltp,但是在安装的过程中,需要安装VS,不同版本的...原创 2018-11-27 15:23:25 · 4773 阅读 · 2 评论 -
FoolNLTK简介
foolnltk是一个基于深度学习的中文分词工具1、特点:基于BiLSTM模型训练而成包含分词、词性标注、实体识别,都有比较高的准确率用户定义词典知乎网址:https://www.zhihu.com/search?type=content&q=FoolNLTK%E7%AE%80%E4%BB%8Bgit 网址:https://github.com/rockyzhengwu/F...原创 2018-12-24 14:21:56 · 2405 阅读 · 0 评论 -
python调用各个分词包
目前分词的难点(1)分词规范:公说公有理婆说婆有理(2)歧义切分:歧义本身就是一个问题,暂时没有得到解决(3)未登录词:语言是一个神奇的事情,总会有创意的人想出创意的词来表达特定的含义,而且这这个游戏乐此不疲,所以这个问题会一直都存在接下来将python可能调用的分词包进行了汇总了(参照网址:https://mp.weixin.qq.com/s/-iH8QiAbpyOV-692XC5Nz...原创 2019-04-23 15:50:59 · 1520 阅读 · 0 评论 -
python3 'ascii' codec can't encode character u'\uff08' in position 9: ordinal not in range(128)
这个是编码的问题在python2版本中,需要在程序的开头部分加上下面的代码即可解决问题:# encoding=utf8import sysreload(sys)sys.setdefaultencoding('utf8')但是在python3版本中加上上面的代码则会报错,需要在执行的时候,加上编码的指定就可解决上述的问题PYTHONIOENCODING=utf-8 ...原创 2019-05-30 11:19:25 · 1831 阅读 · 0 评论 -
gensim做主题模型
#coding:utf-8import jiebafrom gensim import corpora,models,similaritiesfrom jieba import analyse##引用TF-IDF关键词抽取接口tfidf = analyse.extract_tags##keywords = jieba.analyse.extract_tags(str1, topK=...转载 2018-09-05 14:20:40 · 1202 阅读 · 0 评论 -
python之Counter类
当我们需要对文档进行字出现次数的统计,通常会用到字典,代码写起来比较长:但使用Python自带的一个Counter类,代码只需短短的几行就可以实现上述代码的功能,具体代码如下所示:当我们统计文件中、列表中等的字、词出现的次数时,可以使用Counter类,这样就可以不用新建字典进行统计,可以减少代码的行数,用起来比较方便...原创 2018-08-13 15:44:47 · 828 阅读 · 0 评论 -
listdir 读取某一目录下面的所有文件
某一文件下面的.txt文本比较多,那么怎么才能讲该文件夹下面的所有的文件中的内容读取出来,这样就需要一个函数直接读取某一文件夹里面所有的文件。在python中listdir就可以实现上述的功能程序代码如下所示:def data_all():##该函数主要是将所有的.txt文本合并成一个文件 f1 = open('./data/data_all.txt','w',encoding='...原创 2018-08-09 14:48:22 · 1005 阅读 · 0 评论 -
shuffle与permutation的区别
shuffle与permutation的区别函数shuffle与permutation都是对原来的数组进行重新洗牌(即随机打乱原来的元素顺序);区别在于shuffle直接在原来的数组上进行操作,改变原来数组的顺序,无返回值。而permutation不直接在原来的数组上进行操作,而是返回一个新的打乱顺序的数组,并不改变原来的数组。示例: a = np.arange(12) p...转载 2018-08-09 15:29:05 · 1001 阅读 · 0 评论 -
python中的uuid生成随机数
uuid是128位的全局唯一标识符uuid.uuid1() 可以保证全球范围内的唯一性uuid.uuid2() 目前python 没有这个方法uuid.uuid3(namespace,name) 通过计算一个命名空间和名字的md5散列值来uuid.uuid4() 通过伪随机数得到uuid,是有一定概率重复的uuid.uuid5(namespace,name) 和uuid3基...原创 2018-07-31 19:22:25 · 7657 阅读 · 0 评论 -
ImportError: No module named 'cPickle'
原因在于python的版本问题:在python2中:import cPickle as pickle在python3中:import pickle as pickle 针对python不同的版本选择不同的导入模块原创 2018-08-10 10:38:37 · 6366 阅读 · 2 评论 -
psycopg2.ProgrammingError:relation ""does not exits
在python读取数据库中的数据,表的名字为'PanJueShu',名字中含有大写的字母,此时代码为:cur.execute("select instrument_content from PanJueShu_DaoQie" )这样执行之后就会报上面的错误,说表名不存在当代码改成下面的代码:cur.execute("select instrument_content fro...原创 2018-08-06 19:01:00 · 6683 阅读 · 0 评论 -
SQL查询语句中的 limit offset
经常用到在数据库中查询中间几条数据的需求比如下面的sql语句:① selete * from testtable limit 2,1;② selete * from testtable limit 2 offset 1;注意:1.数据库数据计算是从0开始的2.offset X是跳过X个数据,limit Y是选取Y个数据3.limit X,Y 中X表示跳过X个数据,读...转载 2018-08-06 19:03:18 · 5481 阅读 · 1 评论 -
python的变量名的命名规则以及输出所有的保留字
命名:为程序元素关联一个名称,要保证唯一性规则:(1)大小写字母、数字、下划线都可以出现在变量的名字当中(2)不能以数字开头(3)大小写敏感(4)不能和保留字相同下面的代码可以将python中的所有的保留字输出来>>> import keyword>>> print keyword.kwlist输出的结果如下所示:...原创 2018-08-06 19:54:16 · 2770 阅读 · 0 评论 -
python包的安装
1、textblobTextBlob是一个用Python编写的开源的文本处理库。它可以用来执行很多自然语言处理的任务,比如,词性标注,名词性成分提取,情感分析,文本翻译,在windows下暗转命令如下所示:pip install -U textblob2、tflearnpip install tflearn3、chardet 编码检测pip install cha...原创 2018-08-07 09:58:04 · 743 阅读 · 0 评论 -
shuffle函数的使用
最近在训练一个机器学习的模型,但是由于语料的问题,使得训练集合测试集的语料的标签补平衡,因此想将语料进行打乱处理,于是找到了python中的shuffle函数,具体的使用方法如下所示:shuffle函数的是将序列中的所有元素随机排序例子:shuffle()是不能直接访问的,需要导入 random 模块,然后通过 random 静态对象调用该方法只是将列表中的第一层元素进行了随机...原创 2018-08-07 15:35:58 · 19180 阅读 · 1 评论 -
python3 tkinter的入门
#coding:utf-8'''界面的开始学习'''import tkintertop = tkinter.Tk()quit = tkinter.Button(top,text='hello world',command=top.quit)quit.pack()tkinter.mainloop()原创 2017-10-13 09:56:42 · 504 阅读 · 0 评论 -
python 内置函数
1、python获取当前字符串编码格式 chardet安装:pip install chardet在python2中,经常会遇到编码的问题,在python中有一个包可以打印出当前字符串的编码格式,具体的如下所示import chardetprint chardet.detect(html)如图所示:测出的编码是ascii,其中confidence字段为1.0,表示检测的...原创 2018-08-15 14:54:43 · 1199 阅读 · 0 评论 -
KeyedVectors python 从词向量文件中快速生成{词:词向量}
在做NLP的一些深度学习任务中,需要从提前训练好的词向量中读取词的向量表示,若自己写代码读取文件,代码相对长一些可以利用KeyedVectors 进行向量的读取文件的内容如下:代码如下所示:#coding:utf-8import gensimfrom gensim.models import KeyedVectorsword2vec_model_path = './d...原创 2018-08-15 15:39:22 · 13372 阅读 · 6 评论 -
python编码问题
#coding:utf-8import os'''将案号与数字对应上'''dirname = u'1_xunwenbilu/'#############获得指定文件夹下面的所有文件的名字list1 = os.listdir(dirname)print(list1)print 222with open('1_xunwenbilu/1.txt','w') ...原创 2018-07-20 17:21:40 · 192 阅读 · 0 评论