学习
文章平均质量分 58
小白的进阶
立体视觉,机器学习,Python,搜索
展开
-
依存句法分析 -- tag和dep释义
依存句法分析(Dependency Parsing, DP)是通过分析语言单位内成分之间的依存关系揭示其句法结构,主张橘子 中核心动词是支配其它成分的中心成分,而它本身却不受其他任何成分的支配,所有受支配成分都以某种关系从属于支配者。依存句法的结构没有非终结点,词与词之间直接发生依存关系,构成一个依存对,其中一个是核心词,也叫支配词,另一个叫修饰词,也叫从属词。依存关系用一个邮箱弧表示,叫做依存弧。依存句法分析的五个条件:(1)一个句子中只有一个成分是独立的(2)句子的其他成分都从属与某一成分。原创 2023-02-14 10:31:34 · 2415 阅读 · 1 评论 -
关于Spacy
关于Spacy安装遇到的错误原创 2023-01-05 11:43:16 · 1188 阅读 · 0 评论 -
Linux下安装Python3
linux下安装python3的详细步骤转载 2022-09-19 16:00:47 · 2184 阅读 · 1 评论 -
python2.X升级到python3.X
背景Linux自带的python版本是2.7.5,不能满足现阶段的开发需求,所以打算升级到python3.6.6步骤1、查看当前python版本[root@kuick-k8s-Alpha-node2-63 ~]# python --versionPython 2.7.52、下载python3.6.6的安装包[root@kuick-k8s-Alpha-node2-63 opt]# wget https://www.python.org/ftp/python/3.6.6/P..原创 2022-04-06 20:46:06 · 4135 阅读 · 0 评论 -
各编程语言中 Base64 编码解码的方法
各编程语言中Base64编码解码的方法(其中Stringstr 表示原文本,Stringbase64 表示编码结果)语言 Base64 编码 Base64 解码 Java base64 =newBASE64Encoder().encode(str.getBytes()); str =newString(newBASE64Decoder().decodeBuffer(base64)); JavaScript base64 = btoa(str);...转载 2022-03-29 10:38:50 · 1300 阅读 · 0 评论 -
BM25算法 原理简介
bm25 是什么?bm25 是一种用来评价搜索词和文档之间相关性的算法,它是一种基于概率检索模型提出的算法,再用简单的话来描述下bm25算法:我们有一个query和一批文档Ds,现在要计算query和每篇文档D之间的相关性分数,我们的做法是,先对query进行切分,得到单词$q_i$,然后单词的分数由3部分组成:query中每个单词和之间的相关性 单词$q_i$和D之间的相关性 每个单词的权重最后对于每个单词的分数我们做一个求和,就得到了query和文档之间的分数。...原创 2021-09-06 20:10:27 · 14234 阅读 · 2 评论 -
crontab命令详解
crontab 概念crontab命令常见于Unix和类Unix的操作系统之中,用于设置周期性被执行的指令。该命令从标准输入设备读取指令,并将其存放于“crontab”文件中(是“cron table”的简写),以供之后读取和执行。该词来源于希腊语 chronos(χρνο),原意是时间。通常,crontab储存的指令被守护进程激活, crond常常在后台运行,每一分钟检查是否有预定的作业需要执行。这类作业一般称为cron jobs。简单点说:就是和闹钟的概念类似。就是定时执行一、检查 cront转载 2021-08-07 12:27:08 · 10106 阅读 · 1 评论 -
MAC下拼音输入法不显示汉字提示
两种办法: 在键盘偏好设置里面把中文输入发去掉然后在添加就可以恢复 2.打开活动监视器(先把输入法切换到美式输入),然后找到中文输入法进程,强制退出这个进程就可以了。...原创 2021-08-07 12:14:15 · 9122 阅读 · 2 评论 -
Linux中 du、df 和 free 以及它们的区别
一 、du命令格式:du [参数] [文件或目录名称]du用来显示每个文件或目录的磁盘使用空间,如果后边不跟目录或者文件,表示统计的是当前所在的目录的容量信息常用参数如下:-h:以易读的容量格式(G/M)列出-s:仅列出总容量与df不同的是,du这个命令会到相应的目录中去查找所有的文件数据,所以运行时间会相对长一点按照目录的占用空间大小排序du -h --max-depth=1 | sort -hrdu -sh *作用:查看目录的真实大小语法:#du -sh 目转载 2021-07-27 13:51:53 · 1891 阅读 · 0 评论 -
autoreconf命令参数说明
在linux中通过拷贝文件安装软件,执行make 操作时出现如下问题Makefile:372: recipe for target 'aclocal.m4' failed解决办法:在linux终端下执行 :autoreconf -vfi通过拷贝来的源码,在配置文件中保留原来的配置,所以需要使用autoreconf来更新已经生成的配置文件必要参数 -v 详细报告处理-d 不删除临时文件-f 认为所有的文件都是过期的文件/强制执行-i 复制辅助文件-s 创建符号链接,而不...原创 2021-07-15 15:05:36 · 1328 阅读 · 0 评论 -
Redis如何防止雪崩、穿透、击穿?
Redis如何防止雪崩?什么是Redis缓存雪崩:Redis不可能把所有的数据都缓存起来(内存昂贵且有限),所以Redis需要对数据设置过期时间,并采用的是惰性删除+定期删除两种策略对过期键删除。如果缓存数据设置的过期时间是相同的,并且Redis恰好将这部分数据全部删光了。这就会导致在这段时间内,这些缓存同时失效,全部请求到数据库中。这就是Redis缓存雪崩。缓存雪崩会造成数据库直接崩溃,从而导致整个系统瘫痪。如何防止Redis缓存雪崩:(1)在缓存的时候给时间加上一个随机值,设置不同的缓原创 2021-03-07 17:59:44 · 4144 阅读 · 0 评论 -
剑指offer - 61 -- 序列化二叉树 - C++
题目描述请实现两个函数,分别用来序列化和反序列化二叉树二叉树的序列化是指:把一棵二叉树按照某种遍历方式的结果以某种格式保存为字符串,从而使得内存中建立起来的二叉树可以持久保存。序列化可以基于先序、中序、后序、层序的二叉树遍历方式来进行修改,序列化的结果是一个字符串,序列化时通过 某种符号表示空节点(#),以 ! 表示一个结点值的结束(value!)。二叉树的反序列化是指:根据某种遍历顺序得到的序列化字符串结果str,重构二叉树。例如,我们可以把一个只有根节点为1的二叉树序列化为"1,..原创 2021-01-31 19:50:59 · 164 阅读 · 0 评论 -
树、二叉树、二叉搜索树、B树、B+树的区别
概述关于树的概念很多,B树,B+树,红黑树等等。下面根据我自己的学习和理解。给出一些中文的定义。什么是二叉树(Binary Tree)二叉树是每个节点最多有两个子节点的树。二叉树的叶子节点有0个字节点,二叉树的根节点或者内部节点有一个或者两个字节点。什么是二叉搜索树(Binary Search Tree)二叉查找树又叫二叉搜索树,它或者是一棵空树,或者是具有下列性质的二叉树:若它的左子树不空,则左子树上所有结点的值均小于它的根结点的值;若它的右子树不空,则右子树.转载 2021-01-29 00:02:51 · 1648 阅读 · 1 评论 -
undefined symbol问题的查找、定位与解决方法
编译生成动态链接库后,调用时出现:# lichunhong @ lichunhong-ThinkPad-T470p in ~/Documents/src/effective_robotics_programming_with_ros-master/catkin_ws on git:lichunhong/dev x [18:54:05] C:127$ rosrun path_plan PathPlanSimulation/home/lichunhong/Documents/src/effective转载 2020-11-06 17:04:15 · 11214 阅读 · 7 评论 -
shell脚本获取今天、昨天、前天以及n天前的日期
1、获取今天的日期log=$(date -d "now" +%Y-%m-%d)echo ${log}2、获取昨天的日期log2=$(date -d "yesterday" +%Y-%m-%d)echo ${log2}或者log2=$(date -d "1 day ago" +%Y-%m-%d)echo ${log2}3、获取前天的日期log3=$(date -d"2 day ago" +%Y-%m-%d)echo ${log3}4、获取具体日期的前几天log4=$(d原创 2020-11-04 11:47:58 · 6064 阅读 · 0 评论 -
剑指offer-2 -- 替换空格 - C++
题目描述:请实现一个函数,将一个字符串中的每个空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。思路:由于函数返回为void,说明此题不能另外开辟数组,需要in-place操作。我们知道字符串的遍历无非是从左到右和从右到左两种。1)如果从左到右,会发现如果遇到空格,会将原来的字符覆盖。于是,此方法不行。2)那么就考虑从右向左,遇到空格,就填充“20%“,否则将原字符移动应该呆的位置。class Solutio...原创 2020-09-07 23:34:09 · 132 阅读 · 0 评论 -
剑指offer-1 -- 二维数组中的查找 - C++
题目描述:在一个二维数组中(每个一维数组的长度相同),每一行都按照从左到右递增的顺序排序,每一列都按照从上到下递增的顺序排序。请完成一个函数,输入这样的一个二维数组和一个整数,判断数组中是否含有该整数。示例:现有矩阵 matrix 如下:[ [1, 4, 7, 11, 15], [2, 5, 8, 12, 19], [3, 6, 9, 16, 22], [10, 13, 14, 17, 24], [18, 21, 23, 26, 30]]给定 t原创 2020-09-07 23:17:44 · 235 阅读 · 0 评论 -
使用python在hadoop下编写map-reduce
Hadoop Streaming提供了一个便于进行MapReduce编程的工具包,使用它可以基于一些可执行命令、脚本语言或其他编程语言来实现Mapper和 Reducer,从而充分利用Hadoop并行计算框架的优势和能力,来处理大数据。部署hadoop环境,这点可以参考 http://www.powerxing.com/install-hadoop-in-centos/部署hadoop完成...原创 2019-11-15 15:53:42 · 1093 阅读 · 0 评论 -
SecureCRT上操作SVN
1.从svn下载代码到本地一般新建一个文件夹,下载所需的代码,例如 mkdir code,然后进入code文件夹中,开始进行下载svn co https://svn路径 ./此处需要注意:如果想要下载一整个文件夹下的代码/项目,在填写svn路径时,最后面不要加“/”例如在code文件夹下,操作 svn co https://svn1.baidu.com.cn/search ./ ...原创 2019-11-15 15:36:13 · 982 阅读 · 0 评论 -
Python中BeautifuSoup库的用法
BeautifulSoup简介Beautiful Soup是python的一个库,最主要的功能是从网页抓取数据。官方解释如下:Beautiful Soup提供一些简单的、python式的函数用来处理导航、搜索、修改分析树等功能。它是一个工具箱,通过解析文档为用户提供需要抓取的数据,因为简单,所以不需要多少代码就可以写出一个完整的应用程序。Beautiful Soup自动将输入文档转换为...原创 2019-11-13 19:08:11 · 745 阅读 · 0 评论 -
requests库的 text / content / json的区别
最近在爬一些数据,刚开始用urllib.request 库,一直连不到数据 ;后来通过CHROME浏览器的F12,发现该 网站用的是JSON格式{}'Content-Type': 'application/json',},不同于以往的提交方式“Content-Type: text/html; charset=utf-8"试了各种方法 ,一直不能取得数据。看的许多介绍方法中有用“requ...原创 2019-11-13 16:09:29 · 3960 阅读 · 0 评论 -
urllib、urllib2、requests的区别
urllib和urllib2的区别urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。urllib2.urlopen可以接受一个Request对象或者url,(在接受Request对象时候,并以此可以来设置一个URL 的headers)urllib.urlopen只接收一个urlurllib 有urlencode,urllib2没有,这也是为什么总是u...原创 2019-11-13 14:02:37 · 2978 阅读 · 0 评论 -
requests + xpath抓取网站内容
1.Requests第三方的python HTTP库,其口号是“让HTTP服务人类(HTTP for Humans)”,功能丰富,接口简洁优雅,文档也很完备。支持python 2.6-3.5安装通过 pip 安装:pip install requests示例:获取某个网页import requestsr = requests.get('http://www.bai...原创 2019-11-12 20:27:25 · 1200 阅读 · 0 评论 -
每个月有5000元结余,买基金定投好还是扔余额宝?
余额宝……也行,就看你能不能接收那个收益了。个人的推荐还是指数基金,因为收益会高一些,只要投资的时间足够长,风险也慢慢降低了。以下方法是投资时间3-5年的方法,不建议短期投资,短期要用钱的小伙伴一定要投余额宝。我的建议非常简单,越早接触指数基金越好。这篇文章你看完,认真实践,你可以有最低10%的年化收益率。在我自己看来,贵金属我不会碰,因为国家长期走势很好。股票...转载 2019-07-31 19:45:36 · 1658 阅读 · 1 评论 -
pydotplus.graphviz.InvocationException: GraphViz's executables not found
可视化模块GraphViz's executables not found报错解决首先看你是否安装了GraphViz软件如果你是python3.4版本的还可以安装pygraphviz,但是如果是3.5以后的版本,就只能安装pydotplus了,安装这个两个包时使用pip install就好了。但是安装完Graphviz后还是会报错pydotplus.graphviz.Invocat...原创 2019-08-08 15:23:40 · 3109 阅读 · 0 评论 -
windows上pip安装及使用详解
1、pip下载安装配置1.1 python安装及环境变量设置pip是依赖python的,首先检查下windows机器上有没有安装python,或者有没有添加到环境变量中,如果都没有需要安装或者加入环境变量,详细步骤请看:https://blog.csdn.net/m0_37774696/article/details/843105561.2 安装pip将pip的tar包下...原创 2019-08-08 16:30:21 · 73176 阅读 · 6 评论 -
ModuleNotFoundError: No module named 'pycurl'
不同于其他的模块,直接用pip install Moudle就可以安装成功直接使用pip安装模块pycurl时会报如下错误:解决方案:在 http://www.lfd.uci.edu/~gohlke/pythonlibs/ 下载符合你目前python版本的pycurl资源,例如我的是python37,所以我下载的是pycurl‑7.43.0.3‑cp37‑cp37m‑w...原创 2019-08-13 15:08:54 · 4313 阅读 · 0 评论 -
Sobel图像处理详解
首先,我们来开一下计算机是如何检测边缘的。以灰度图像为例,它的理论基础是这样的,如果出现一个边缘,那么图像的灰度就会有一定的变化,为了方便假设由黑渐变为白代表一个边界,那么对其灰度分析,在边缘的灰度函数就是一个一次函数y=kx,对其求一阶导数就是其斜率k,就是说边缘的一阶导数是一个常数,而由于非边缘的一阶导数为零,这样通过求一阶导数就能初步判断图像的边缘了。通常是X方向和Y方向的导数,也就是梯度。原创 2016-09-30 11:10:43 · 5683 阅读 · 2 评论 -
linux中的awk命令详解
1、AWK简介AWK是一种处理文本文件的语言,是一个强大的文本分析工具。2、AWK语法awk [选项参数] 'script' var=value file(s)或awk [选项参数] -f scriptfile var=value file(s)选项参数的说明:-F fs or –field-separator fs指定输入文件折分隔符,fs是一个字符串或者是一个正...原创 2019-08-02 17:33:34 · 300 阅读 · 0 评论 -
shell脚本去重的几种方法
测试文件如下jasonjasonjasonfffffjason第一种去重方法: sort -u 文件名 或者 cat 文件名 | sort -u[root@bogon ~]# sort -u testfffffjason但这样只是将去重后的结果打印在屏幕上,如果想将去重后的内容保存下来,语句为:sort -u 文件名 > 新文件名或者cat 文件...原创 2019-06-11 19:07:54 · 56485 阅读 · 0 评论 -
secureCRT常用命令
常用命令:一、ls 只列出文件名 (相当于dir,dir也可以使用)-A:列出所有文件,包含隐藏文件。-l:列表形式,包含文件的绝大部分属性。-R:递归显示。--help:此命令的帮助。二、cd 改变目录cd /:进入根目录cd :回到自己的目录(用户不同则目录也不同,root为/root,xxt为/home/xxtcd ..:回到上级目录pwd:显示当前所在...原创 2019-06-04 11:02:03 · 24405 阅读 · 0 评论 -
打开/取消 SecureCRT的右键复制功能
在系统维护工作中,经常要在SecureCRT中使用复制黏贴功能,根据不同的需求,有人喜欢右键复制黏贴,有人不喜欢,因为实际工作中经常会不小心复制到一大堆不用的东西,还是使用ctrl+v,来的安全,需要就复制,不需要就不复制。这里介绍开关位置,大家根据需要使用Options->Global Options->Terminal在右边选择或者取消“Copy on select”和“P...原创 2019-05-30 17:54:29 · 8925 阅读 · 1 评论 -
解决:从windows复制到SecureCRT上 vi/vim编辑的文件中,会在行首多很多缩进和空格
secureCRT会将你原来的文本原封不动的按照字符串的样式发送给服务器。所以当你的服务器上的vim设置为autoindent的话,在i模式下,那么它会将secureCRT传输而来的这些字符串再进行一下缩进。若你拷贝的文本中已经有表示缩进的空格或者制表符的话,它们也会被当成字符串,而被缩进。解决办法:1. 在拷贝前输入:set paste (这样的话,vim就不会启动自动缩进...原创 2019-05-30 16:24:02 · 3092 阅读 · 1 评论 -
linux下.tar.gz和.gz文件解压详解
.tar.gz和.gz文件是两种不同的文件,需要区别对待,解压命令当然也不同咯,下面来分享一下他们各自的解压方法。1. .tar.gz文件,这种文件是tar文件的压缩文件,可以使用tar命令进行解压。例如:解压:tar zxvf pythontab.tar.gztar -xjvf httpd-2.4.4.tar.bz2解压文件到指定文件夹: tar xzvf ...原创 2019-04-19 18:23:10 · 475322 阅读 · 10 评论 -
Linux给文件中每一行的前面、后面、指定列添加/删除相同字符
需要用到shell命令awk在前面、后面、指定列添加相同字符(1)给一个文件中的每一行开头插入字符的方法:awk '{print "需要添加的字符" $0}' fileName(2)给一个文件中的每一行结尾插入字符的方法:awk '{print $0 "需要添加的字符"}' fileName(3)给一个文件中的每一行的指定列插入字符的方法:awk '$0=$0X"' fileNa...原创 2019-08-06 16:25:23 · 20582 阅读 · 0 评论 -
curl.perform() pycurl.error: (23, 'Failed writing body (0 != 59)')
在使用python3.7编码时,引入pycurl模块和StringIO模块后,容易引起上述错误导入StringIO模块的解决方案:只有在python2中才能导入StringIO模块,直接fromStringIO importStringIO 即可但是python3,STringIO和cStringIO模块已经没了,要使用的话,需要导入io模块:from io impor...原创 2019-08-13 17:01:15 · 6652 阅读 · 0 评论 -
Hadoop常用命令
参数 作用 示例 返回值 appendToFile 将一个或者多个本地 文件追加到目的文件 hdfsdfs-appendToFilelocalfile /user/hadoop/hadoopfile Returns0onsuccessand1onerror cat 输出文件 hdfsdfs-catfil...原创 2019-09-04 11:07:28 · 206 阅读 · 0 评论 -
Requests快速上手
发送请求使用requests发送网络请求非常简单,一开始需要导入requests模块:import requests然后,尝试获取某个网页。举个例子,我们来获取Github的公共时间线:r = requests.get('https://api.github.com/events')现在,我们有了一个命名为r的Response对象,我们可以从这个对象中获取所有我们想要的信息...原创 2019-08-29 14:19:01 · 338 阅读 · 0 评论 -
Jupyter Notebook 快速入门(下)
从上一篇文章中,我们发现 Jupyter notebook 的基本功能就可以支持完成许多事情。不过它背后的功能和选项并不止于此。本文将进一步介绍一些有用的操作。单元格操作高级单元格操作,将让编写 notebook 变得更加方便。举例如下:如果想删除某个单元格,可以选择该单元格,然后依次点击Edit->Delete Cell; 如果想移动某个单元格,只需要依次点击Edi...原创 2019-08-26 13:10:05 · 233 阅读 · 0 评论 -
numpy 数据类型转换
首先需要导入numpy模块import numpy as np首先生成一个浮点数组a = np.random.random(4)dtype的用法看看结果信息,左侧是结果信息,右侧是对应的python语句我们发现这个数组的type是float64,那我们试着改变一个数组的类型,会有什么样的变化呢?请看下面的截图我们发现数组长度翻倍了!由原来的(4,)变成了(8...原创 2019-08-12 15:25:29 · 82994 阅读 · 5 评论