python
文章平均质量分 55
小白的进阶
立体视觉,机器学习,Python,搜索
展开
-
依存句法分析 -- tag和dep释义
依存句法分析(Dependency Parsing, DP)是通过分析语言单位内成分之间的依存关系揭示其句法结构,主张橘子 中核心动词是支配其它成分的中心成分,而它本身却不受其他任何成分的支配,所有受支配成分都以某种关系从属于支配者。依存句法的结构没有非终结点,词与词之间直接发生依存关系,构成一个依存对,其中一个是核心词,也叫支配词,另一个叫修饰词,也叫从属词。依存关系用一个邮箱弧表示,叫做依存弧。依存句法分析的五个条件:(1)一个句子中只有一个成分是独立的(2)句子的其他成分都从属与某一成分。原创 2023-02-14 10:31:34 · 2503 阅读 · 1 评论 -
关于Spacy
关于Spacy安装遇到的错误原创 2023-01-05 11:43:16 · 1223 阅读 · 0 评论 -
Linux下安装Python3
linux下安装python3的详细步骤转载 2022-09-19 16:00:47 · 2200 阅读 · 1 评论 -
python2.X升级到python3.X
背景Linux自带的python版本是2.7.5,不能满足现阶段的开发需求,所以打算升级到python3.6.6步骤1、查看当前python版本[root@kuick-k8s-Alpha-node2-63 ~]# python --versionPython 2.7.52、下载python3.6.6的安装包[root@kuick-k8s-Alpha-node2-63 opt]# wget https://www.python.org/ftp/python/3.6.6/P..原创 2022-04-06 20:46:06 · 4195 阅读 · 0 评论 -
requests + xpath抓取网站内容
1.Requests第三方的python HTTP库,其口号是“让HTTP服务人类(HTTP for Humans)”,功能丰富,接口简洁优雅,文档也很完备。支持python 2.6-3.5安装通过 pip 安装:pip install requests示例:获取某个网页import requestsr = requests.get('http://www.bai...原创 2019-11-12 20:27:25 · 1222 阅读 · 0 评论 -
python中dict()的高级用法
collections中defaultdict的用法一、字典的键映射多个值将下面的列表转换成字典一个字典就是一个键对应一个单值得映射,而上面的列表中有相同的键,如果你想要一个键映射多个值,那么就需要将这多个值放到另外的序列中,比如list或者set里面,像下面这样:你可以很方便的使用 collections 模块中的 defaultdict 来构造这样的字典。defau...原创 2019-11-12 19:24:42 · 12177 阅读 · 1 评论 -
python 常用的基础函数汇总
1.reverse()函数用于反向列表中元素。语法:list_1.reverse()该方法没有返回值,但是会对列表的元素进行反向排序。aList = [123, 'xyz', 'zara', 'abc', 'xyz']aList.reverse()for i in aList: print(i)输出结果如下:2.range()函数range() ...原创 2019-11-08 16:53:51 · 8830 阅读 · 0 评论 -
python 多进程(mutiprocessing)以及进程间的通信
首先和线程进行比较导入进程标准模块和线程标准模块import multiprocessing as mpimport threading as td定义一个被进程和线程调用的函数def job(a,d): print('aaaaa')创建进程和线程p1 = mp.Process(target=job,args=(1,2))t1 = td.Thread...原创 2019-10-17 18:17:59 · 572 阅读 · 0 评论 -
curl.perform() pycurl.error: (23, 'Failed writing body (0 != 59)')
在使用python3.7编码时,引入pycurl模块和StringIO模块后,容易引起上述错误导入StringIO模块的解决方案:只有在python2中才能导入StringIO模块,直接fromStringIO importStringIO 即可但是python3,STringIO和cStringIO模块已经没了,要使用的话,需要导入io模块:from io impor...原创 2019-08-13 17:01:15 · 6683 阅读 · 0 评论 -
ModuleNotFoundError: No module named 'pycurl'
不同于其他的模块,直接用pip install Moudle就可以安装成功直接使用pip安装模块pycurl时会报如下错误:解决方案:在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载符合你目前python版本的pycurl资源,例如我的是python37,所以我下载的是pycurl‑7.43.0.3‑cp37‑cp37m‑w...原创 2019-08-13 15:08:54 · 4367 阅读 · 0 评论 -
windows上pip安装及使用详解
1、pip下载安装配置1.1 python安装及环境变量设置pip是依赖python的,首先检查下windows机器上有没有安装python,或者有没有添加到环境变量中,如果都没有需要安装或者加入环境变量,详细步骤请看:https://blog.csdn.net/m0_37774696/article/details/843105561.2 安装pip将pip的tar包下...原创 2019-08-08 16:30:21 · 73711 阅读 · 6 评论 -
pydotplus.graphviz.InvocationException: GraphViz's executables not found
可视化模块GraphViz's executables not found报错解决首先看你是否安装了GraphViz软件如果你是python3.4版本的还可以安装pygraphviz,但是如果是3.5以后的版本,就只能安装pydotplus了,安装这个两个包时使用pip install就好了。但是安装完Graphviz后还是会报错pydotplus.graphviz.Invocat...原创 2019-08-08 15:23:40 · 3135 阅读 · 0 评论 -
ModuleNotFoundError: No module named 'PIL'
错误如下:ModuleNotFoundError: No module named 'PIL'解决方法: 运行命令:pip install pillow如果运行该命令 显示Requirement already satisfied: Pillow in c:\program files (x86)\python\lib\site-packages (3.4.2)...原创 2019-08-08 14:47:10 · 732 阅读 · 0 评论 -
python 去除txt文本中的空格、数字、特定字母等方法
使用场景:需要去除txt文本中的空格、数字、特定字母等。需要修改的txt文本叫做:train.txt修改之后保存成:train_output.txt# ecoding=utf-8ifn = r"train.txt"ofn = r"train_output.txt"infile = open(ifn,'rb')outfile = open(ofn,'wb')for eac...原创 2019-07-09 17:44:09 · 12557 阅读 · 6 评论 -
shell脚本去重的几种方法
测试文件如下jasonjasonjasonfffffjason第一种去重方法: sort -u 文件名 或者 cat 文件名 | sort -u[root@bogon ~]# sort -u testfffffjason但这样只是将去重后的结果打印在屏幕上,如果想将去重后的内容保存下来,语句为:sort -u 文件名 > 新文件名或者cat 文件...原创 2019-06-11 19:07:54 · 57008 阅读 · 0 评论 -
python文件打开方式详解——a、a+、r+、w+、rb、rt区别
1.排除文件打开方式错误:r只读,r+读写,不创建,即需要事先存在一个文件以供读/读写,若不存在文件会报错w新建只写,w+新建读写,二者都会将文件内容清零,即事先不需要有该文件存在,若已经存在则会覆盖(以w方式打开,不能读出。w+可读写)w+与r+区别:r+:可读可写,若文件不存在,报错;w+: 可读可写,若文件不存在,创建r+与a+区别:fd = open("1.t...原创 2019-06-14 11:25:49 · 23343 阅读 · 1 评论 -
Python isinstance() 函数
描述isinstance() 函数来判断一个对象是否是一个已知的类型,类似 type()。isinstance() 与 type() 区别: type() 不会认为子类是一种父类类型,不考虑继承关系。 isinstance() 会认为子类是一种父类类型,考虑继承关系。 如果要判断两个类型是否相同推荐使用 isinstance()。语法以下是 isinstan...原创 2019-06-05 15:41:20 · 10459 阅读 · 0 评论 -
python正则表达式去除两个特殊字符间的内容方法
以去掉去掉<!--和-->为例进行说明:def clearContentWithSpecialCharacter(content): # 先将<!--替换成,普通字符l content = content.replace("<!--","l")# 再将-->替换成,普通字符l content = content.replace("-->","l"...原创 2019-05-21 21:02:50 · 5604 阅读 · 1 评论 -
IDLE清屏方法
使用Python IDLE时发现并没有清空当前窗口的快捷键,也没有像 clear 这样的命令,使用非常不便。下面就来讲一下IDLE的清屏方法首先新建一个ClearWindow.py脚本,并把它放在Python安装目录Python XXX\Lib\idlelib下面(XXX为你的python版本,比如2.7)"""Clear Window ExtensionVersion: 0....原创 2019-08-09 10:51:33 · 7981 阅读 · 3 评论 -
python运行.ipynb文件
首先需要安装jupyter notebook在cmd下进行安装,类似于安装python的模块工具pip install jupyter notebook安装成功以后,在cmd下输入jupyter notebook稍等一会儿就会出现如下的语句----------------------------------------------------------------...原创 2019-08-14 15:04:05 · 17352 阅读 · 0 评论 -
Python中的逻辑回归(Logistic Regression)函数
1. 概述 在scikit-learn中,与逻辑回归有关的主要是这3个类。LogisticRegression, LogisticRegressionCV 和logistic_regression_path。其中LogisticRegression和LogisticRegressionCV的主要区别是LogisticRegressionCV使用了交叉验证来选择正则化系数C。而Logistic...原创 2018-05-30 17:13:13 · 40442 阅读 · 1 评论 -
python split()与strip()的区别
split()Pythonsplit()通过指定分隔符对字符串进行切片,如果参数 num 有指定值,则分隔 num+1 个子字符串split() 方法语法:str.split(str="", num=string.count(str))参数解释:str -- 分隔符,默认为所有的空字符,包括空格、换行(\n)、制表符(\t)等。 num -- 分割次数。默认为 -1, ...原创 2019-09-11 15:28:22 · 2071 阅读 · 2 评论 -
IndentationError: unindent does not match any outer indentation level
【问题】一个python脚本,本来都运行好好的,然后写了几行代码,而且也都确保每行都对齐了,但是运行的时候,却出现语法错误:IndentationError: unindent does not match any outer indentation level【解决过程】1.对于此错误,最常见的原因是,的确没有对齐。但是我根据错误提示的行数,去代码中看了下,没啥问题啊。都是用...原创 2019-09-10 19:43:12 · 16915 阅读 · 1 评论 -
Requests快速上手
发送请求使用requests发送网络请求非常简单,一开始需要导入requests模块:import requests然后,尝试获取某个网页。举个例子,我们来获取Github的公共时间线:r = requests.get('https://api.github.com/events')现在,我们有了一个命名为r的Response对象,我们可以从这个对象中获取所有我们想要的信息...原创 2019-08-29 14:19:01 · 353 阅读 · 0 评论 -
python 删除文本文件中每一行末尾的^M符号
1.^M字符的来历和作用:在DOS/Windows里,文本文件的换行符为\r\n,而在*nix系统里则为\n,所以DOS/Windows里编辑过的文本文件到了*nix里,每一行都多了个^M。所以^M只是一个换行符号,没有实际的用处,我们可以将它保留,也可以将它删除。下面我们介绍如何在Linux中删掉^M2. 方法一:不需要打开文件,直接替换:sed -i "s/^M/\ /g...原创 2019-08-28 14:47:55 · 5270 阅读 · 2 评论 -
Jupyter Notebook 快速入门(下)
从上一篇文章中,我们发现 Jupyter notebook 的基本功能就可以支持完成许多事情。不过它背后的功能和选项并不止于此。本文将进一步介绍一些有用的操作。单元格操作高级单元格操作,将让编写 notebook 变得更加方便。举例如下:如果想删除某个单元格,可以选择该单元格,然后依次点击Edit->Delete Cell; 如果想移动某个单元格,只需要依次点击Edi...原创 2019-08-26 13:10:05 · 245 阅读 · 0 评论 -
Python 计算多个特征之间的相关性
线性相关:主要采用皮尔逊相关系数来度量连续变量之间的线性相关强度;线性相关系数|r| 相关程度0<=|r|<0.3 低度相关0.3<=|r|<0.8 中度相关0.8<=|r|<1 高度相关1 函数相关分析函数:DataFrame.corr()Series.corr(other)说明:如果...原创 2019-08-22 19:20:37 · 31183 阅读 · 0 评论 -
numpy 数据类型转换
首先需要导入numpy模块import numpy as np首先生成一个浮点数组a = np.random.random(4)dtype的用法看看结果信息,左侧是结果信息,右侧是对应的python语句我们发现这个数组的type是float64,那我们试着改变一个数组的类型,会有什么样的变化呢?请看下面的截图我们发现数组长度翻倍了!由原来的(4,)变成了(8...原创 2019-08-12 15:25:29 · 83218 阅读 · 5 评论 -
Jupyter Notebook 快速入门(上)
Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。在本文中,我们将介绍 Jupyter notebook 的主要特性,以及为什么对于希望编写漂亮的交互式文档的人来说是一个强大工具。开启 notebook 的文件夹中启动 Jupyter 主界面,如下所示:如果想新建一个 notebook,只需要点击New,选...原创 2019-08-24 12:14:44 · 504 阅读 · 0 评论 -
linux 将字符串中的斜线替换成空格
1. 如果是直接替换某个文件中的字符,不需要打开文件,直接替换:sed -i "s/字符串/\ /g" 文件名2.如果是通过vi打开了某个文件,然后需要替换其中的字符 :%s/字符串/ /g 然后回车延伸阅读:上述两种方法中s代表替换指令;/g 表示的是替换每行的所有匹配;批量替换 替换dir文件夹下所有文件中的a字符变成A字符:sed -i "s/a/A/...原创 2019-08-14 20:32:53 · 2753 阅读 · 0 评论 -
grep命令用法解析
作为linux中最为常用的三大文本(awk,sed,grep)处理工具之一,掌握好其用法是很有必要的。首先谈一下grep命令的常用格式为:grep [选项] ”模式“ [文件]grep家族总共有三个:grep,egrep,fgrep。常用选项: -E :开启扩展(Extend)的正则表达式。 -i :忽略大小写(ignore case)。 -v :反过来(inv...原创 2019-04-22 19:31:51 · 35673 阅读 · 0 评论 -
基于Python的时间戳之间的转换
1.将字符串的时间转换为时间戳import timea = "2018-04-27 17:49:00"#转化为数组timeArray = time.strptime(a, "%Y-%m-%d %H:%M:%S")#转换为时间戳timeStamp = int(time.mktime(timeArray))#最终结果为15248225402.字符串格式更改"""...原创 2019-03-13 20:40:57 · 1159 阅读 · 0 评论 -
Python 对文件和文件夹的基本操作
python中对文件、文件夹的操作需要涉及到os模块和shutil模块。 创建文件:1) os.mknod("test.txt") 创建空文件2) open("test.txt",w) 直接打开一个文件,如果文件不存在则创建文件 创建目录:os.mkdir("file") 创建目录 复制文件:...原创 2018-10-19 16:40:29 · 352 阅读 · 0 评论 -
Python的算数运算符
运算符 描述 实例 + 加 - 两个对象相加 a + b 输出结果 30 - 减 - 得到负数或是一个数减去另一个数 a - b 输出结果 -10 * 乘 - 两个数相乘或是返回一个被重复若干次的字符串 a * b 输出结果 200 / 除 - x除以y b / a 输出结果 2 % 取模 - 返回除法的余数 ...原创 2018-08-22 21:08:48 · 618 阅读 · 0 评论 -
Numpy中的tile方法
在讲tile方法之前,先要讲一下Numpy数组中的几个概念。在NumPy中,数组这一类又被称为ndarray。1、ndarray.ndim指数组的维度,即数组轴(axes)的个数,其数量等于秩(rank)。通俗地讲,我们平时印象中的数组就是一维数组,维度为1、轴的个数为1、秩也等于1;最常见的矩阵就是二维数组,维度为2、轴的个数为2(可以理解为由x轴、y轴组成)、秩等于2;我们所知的空...原创 2018-08-22 20:59:56 · 1220 阅读 · 0 评论 -
numpy函数:shape用法
shape函数是numpy.core.fromnumeric中的函数,它的功能是读取矩阵的长度,比如shape[0]就是读取矩阵第一维度的长度。它的输入参数可以使一个整数表示维度,也可以是一个矩阵。这么说你可能不太理解,我们还是用各种例子来说明他的用法:1、一维矩阵[1]返回值为(1L,)>>>shape([1])(1L,)2、二维矩阵,返回两个值>&...原创 2018-08-22 20:46:42 · 24226 阅读 · 1 评论 -
Python Numpy详细介绍
NumPy - 简介NumPy 是一个 Python 包。 它代表 “Numeric Python”。 它是一个由多维数组对象和用于处理数组的例程集合组成的库。Numeric,即 NumPy 的前身,是由 Jim Hugunin 开发的。 也开发了另一个包 Numarray ,它拥有一些额外的功能。 2005年,Travis Oliphant 通过将 Numarray 的功能集成到 Num...转载 2018-08-02 20:02:21 · 3465 阅读 · 1 评论 -
Python 中常见字符编码和解码方面的错误及其解决办法
Python 2.x中的字符编码,设计的的确不好,导致初学者,甚至是即使用Python很长时间的人,都会经常遇到字符编解码方面的错误。下面就把一些常见情,尽量的都整理出来,并给出相应的解决办法。看此文之前Python中字符编码所涉及的背后逻辑(从你输入字符,到终端显示字符的背后过程)在去了解Python编码解码之前,还有个更加重要,但是很多时候却被其他解释相关知识的人所忽略的问题,那就是:对于Py...转载 2018-05-31 14:48:47 · 4451 阅读 · 0 评论 -
Python中join()方法的使用
描述: Python的join()方法用于将序列中的元素以指定的字符连接生成一个新的字符串语法: str.join(sequence)参数: sequence 要连接的元素序列返回值: 返回通过指定字符连接序列中的元素后生成的新的字符串实例: #!/usr/bin/python# _*_ coding: UTF-8 _*_str = "-";seq = ...原创 2018-05-30 14:41:11 · 13123 阅读 · 9 评论 -
SecureCRT 上传下载文件夹(压缩及解压缩)
tar以下五个是独立的命令,压缩和解压缩都要用到且只能用到其中一个,可以和别的命令连用。-c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件以下参数是根据需要在压缩或解压档案时可选的,且可以多选。-z:有gzip属性的-j:有bz2属性的-Z:有compress属性的-v:显示所有过程-O:将文件解开到标准输出下面的参数-f是必须的-f: 使用档案...原创 2018-06-06 10:47:02 · 15351 阅读 · 1 评论