自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 [已解决] vscode 跳转 python 代码失败

setting -> 输入 go to definition -> 将下列两项配置改为 goto。

2024-03-19 17:00:54 450

原创 ubuntu系统安装Xmind,报错及解决方案

ubuntu系统安装Xmind

2022-08-24 19:29:16 766 3

原创 minicom串口工具使用

minicom串口工具使用

2022-07-22 11:48:42 1457

原创 (已解决)ImportError: cannot import name ‘soft_unicode‘ from ‘markupsafe‘

版本不兼容问题

2022-07-11 17:14:17 3466

原创 networkx绘图出现中文乱码(方块)

如标题所示,解决方案:通过rc配置文件来设置字体参数,加入以下三行代码即可:from pylab import mplmpl.rcParams['font.sans-serif'] = ['SimHei']mpl.rcParams['axes.unicode_minus']=False重新运行代码中文显示正常。...

2022-02-14 11:16:29 1336 2

原创 安装pyahocorasick,配置Microsoft Visual C++

背景笔者要安装cpca包,在此之前需要安装pyahocorasick,但是报错缺少Microsoft Visual C++,通过visual studio build tools安装环境一直出现软件包损坏无法安装的问题,证书也存在,但是就是不能成功安装,选择internet下载包也没用。解决方法 最后笔者通过visual studio installer安装的,选择community版本,选择单个组件,组件中只需要选择windows 10 SDK这一个选项即可,选择了这一个会有一些...

2021-12-02 10:43:09 391

原创 Neo4j 4+版本安装教程

教程有很多,主要是注意版本对应:Neo4j最新版本为4.3.6,支持该版本为jdk11,详情见:neo4j与jdk版本_Zoooozz的博客-CSDN博客1、JDK11jdk11下载Java Archive Downloads - Java SE 11,安装教程可参考: JDK 11.0.2 的下载安装教程_小符的博客-CSDN博客_jdk11安装教程2、Neo4j 社区版本安装教程参考:https://www.jb51.net/article/13...

2021-10-24 22:39:18 3426

原创 Shell执行任意时间的脚本

1、获取当前时间戳从1970-01-01 00:00:00 UTC到现在的秒数:echo `date '+%s'`2、运行了n个小时后的时间戳这里的n可能为小数,因此涉及shell的小数相乘处理:`awk -v x=3600 -v y="$n" 'BEGIN{printf "%.0f\n",x*y}'`3、完整代码剩下的一个循环即可解决:n=$1 #作为运行参数传入currentTimeStamp=`date '+%s'` #开始时间戳tmp=`awk -v

2021-07-21 15:15:43 405

原创 如何让爬虫工具不自动过滤重复数据

很多情况下,我们爬取某个网站的数据都需要用到爬虫工具,比如爬山虎,当爬取数据的所有字段都重复时,采集器会自动帮我们过滤掉重复数据,但是如果不想过滤掉重复数据怎么办呢?解决方法:时间戳。以爬山虎为例,如下:时间戳在爬取过程中一定是一个唯一值,加入时间戳的字段后,每一条数据就不会再存在完全相同,这时候就可以保留重复的数据了。...

2021-04-21 10:48:59 312

原创 微博话题下的数据爬取

1、前言 新浪微博中,一个话题下各个媒体或用户发表在平台发表的信息是舆情研究的一个很重要的数据来源,这里记录一下一个话题下数据的爬取方式,以“#美国疫情#”话题为例。2、话题下数据爬取 首先参考这篇文章,分析话题下数据爬取的结构,然后仿照示例得到如下代码:import requestsfrom urllib.parse import urlencodefrom pyquery import PyQuery as pqimport timeimport xlwt#设...

2021-02-15 16:00:08 7107 55

原创 【已解决】bash: pyinstaller: 未找到命令...

今天在linux环境下安装pyinstaller,环境为python3,安装步骤如下:1、命令安装pyinstallerpip3 install pyinstaller #pip3对应python3版本,根据自己版本需要安装pip3 show pyinstaller #查看是否安装成功,如果成功,显示结果会有pyinstaller路径,后面需要用到2、打包程序pyinstaller -F **.py突然报错“bash: pyinstaller: 未找到命令...”,原

2021-01-06 11:14:34 9250 3

原创 Jpype实现python调用java程序

有时需要在 Python 项目中利用既有的 Java 代码,已达到节省时间和开发成本的目的。JPype 是一个能够让 python 代码方便地调用 Java 代码的工具,从而克服了 python 在某些领域(如服务器端编程)中的不足。1、环境配置 Linux操作系统、jdk1.6、python3.7.5、Jpype0.6; jdk配置上一篇文章已经讲过,python3安装也比较简单,这里着重强调Jpype的版本问题。由于Jpype相当于java和pytho...

2020-12-30 10:23:34 395 1

原创 【已解决】Linux重装jdk,/etc/profile文件配置失效问题

1、背景 安装的CentOS7系统自带jdk1.8,项目需求需要重新安装jdk1.6。2、步骤1、下载.bin文件 jdk-6u45-linux-x64.bin;2、安装jdk1.6;mkdir /usr/java #创建文件夹cp .bin文件路径 /usr/java #将下载的.bin文件复制到/usr/java文件夹cd /usr/java #进入文件目录chmod 777 文件名 #给此文件一个读写执行权限./文件名 #执行安装...

2020-12-28 11:39:55 1178

原创 【已解决】Jena配置问题

1、配置jdk、安装jre,网上教程很多,不赘述;2、下载jena包,配置好环境变量,输入sparql --version出现相应版本号即安装成功;3、安装eclipse,新建JenaTesting工程,接下来就是很多博客遇到的但未解决的问题:(1)工程右键-->build path-->configure build path,导入jar包的时候,将lib和lib-src的包都全部导入到classpath(不是modulepath,切记)否则会出现以下错误:Error

2020-12-13 10:38:39 1310 5

原创 【已解决】CentOS7无法联网问题(NAT模式)

配置VMware Station中Centos7虚拟机的网络,虚拟机信息描述出现:主ip地址 网络信息不可用,这时无论是桥接模式还是NAT都不能正常上网。 参考了很多网上教程,桥接模式网络配置和重启DHCP服务都无法解决我遇到的问题,下面提供NAT模式连接网络的解决方案: VMware->编辑->虚拟网络编辑器,查找到NAT模式对应的名称:VMnet8: win10环境下,cmd打开命令窗口,输入:ipconfig /...

2020-11-06 17:50:30 3546 3

原创 检查安装的tensorflow版本信息

1、tensorflow信息tf.__version__ # 版本信息tf.__path__ # 安装位置2、是否是GPUtf.test.is_gpu_available() # 输出为True则为GPU3、选择GPU还是CPU 整体来说,代码在这两种环境下运行几乎没什么区别,但GPU更加适合复杂密集的高速运算,像入手深度学习进行模型训练首选GPU。...

2020-10-07 09:23:42 314

原创 NLP基础——【1】分词、命名实体识别、词性标注

【初入NLP,主要是整理可参考文章】1、分词 顾名思义就是将一个句子的词单位拆分开来,英文句子用空格分割,存在显性的分词方法,当然人名地名等实体名除外。相比英文,中文就要复杂得多,因为中文由单个字组合而成,字与字之间没有显性的拆分方式,这时候就需要依靠分词工具。 五种常见的中文分词工具: Jieba:Python 中文分词组件,提供分词、词性标注、关键词抽取等,可以用自带的词典或者自己训练词典; SnowNLP:国人自己写的用于中文处理的p...

2020-05-27 13:37:13 2379

原创 【免费GPU】基于Tensorflow等深度学习框架,提高模型训练效率

最近做毕设,和深度学习相关,用自己笔记本跑模型是在鸡肋,于是在网上找到了一些免费GPU平台,记录于此。1.百度AI Studio 这是基于paddle框架的,有低级版(cpu,免费)和高级版(gpu,有限时长),可以自行在上面安装tensorflow等框架,直接pip命令即可安装,很方便,py3自带,只需要自己把项目上传上去就ok,在终端下执行linux命令即可。我用的有16G显存,比我的笔记本大四倍,速度可以。 优点:不用翻墙,操作简单; 免费计算...

2020-05-16 21:55:13 622

原创 计算机顶会英文论文查找

介绍一个计算机领域论文集数据库:DBLP(小白了解,大佬绕过),里面有很多顶会的论文AAAI、NIPS、ACL等,每一年的会议的论文都有专门的合集,而且按照顺序整理相应起止页码,很方便论文引用。...

2020-05-10 19:42:36 862 1

原创 阿里云网站部署流程

1.重置密码,通过工作台或vnc连接服务器2.将linux本地文件复制到远程服务器:scp -r localfile.txt username@192.168.0.1:/home/username/其中,1)scp是命令,-r是参数2)localfile.txt 是文件的路径和文件名3)username是服务器账号4)192.168.0.1是要上传的服务器ip地址5)/hom...

2020-04-12 00:25:02 156

原创 ubuntu18.04安装tensorflow-gpu

【最终选择环境】:ubuntu 18.04 TLS,cuda 10.0,cuDNN 7.4.6,tensorflow-gpu == 1.13.11、ubuntu 18.04 TLS安装教程2、VMwareTools安装3、显卡驱动NVIDIA安装教程4、cuda10.0 以及 cuDNN 7.4.6 安装教程【原文读完再装,不然你就把原作者踩过的坑再踩一遍。如果版本不小心错误,一定...

2020-04-01 11:22:38 177

原创 nltk遇到问题:punkt无法安装

>>>import nltk>>>nltk.download()--------------------------------------------------------------------------- d) Download l) List u) Update c) Config h) Help q) Quit...

2020-03-09 01:55:28 4126 3

原创 Linux下基于Pseudo-Distributed的Hadoop环境搭建

近期学习云计算课程,需要基于linux操作系统搭建伪分布式hadoop环境,主要参考文章,但其中存在部分问题,经修改后搭建过程整理如下。1.创建hadoop用户$ sudo useradd -m hadoop -s /bin/bash #创建hadoop用户,并使用/bin/bash作为shell$ sudo passwd hadoop ...

2019-10-10 10:45:56 719 1

原创 两个栈实现一个队列

昨天面试遇到了这个问题,这个算是一个比较简单的问题,当时有点紧张,考虑问题比较死板,心想没有一个临时变量怎么可能用两个栈实现一个队列呢?后来下来才想到,没错,就是要一个临时变量。问题描述: 最多使用一个临时栈,不许将数据复制到其他存储结构中,实现栈中数据的反序,如:[1,2,3,4]->[4,3,2,1]。思路:代码:def rever...

2019-09-22 00:22:56 77

原创 Python爬取网页内容

1.基本思路 此下载框架由五部分组成,即:URL管理器、网页下载器、网页解析器、调度器和保存器。 其时序图如图所示。 给定一个要访问的url,获取这个html及内容,遍历html中的某一类链接,如a标签的href属性,从这些链接中继续访问相应的html页面,然后获取这些html的固定标签的内容,如果需要多个标签内容,可以...

2019-08-18 16:54:39 463

原创 git bash批量dos2unix

Windows格式文件的换行符为\r\n,而Unix&Linux文件的换行符为\n,dos2unix命令将文件中的\r\n 转换为\n。 在windows上利用git克隆下工程文件,如果源文件是在linux下开发的,就会被自动转换为\r\n换行符,提交的时候会默认所有的python文件都被修改,所以需要重新转换为\n。 修改少量文件命令:dos2unix ...

2019-08-16 17:59:23 1126 2

原创 OJ题目-----Standings

题目描述 solo发现他参加Online Judge的比赛表现很不稳定,于是他翻开历史记录,发现他在每一轮的比赛中他的排名R都能被参赛人数N(包括solo,0<N<10^9)整除,于是他每次参赛都会先预测他的排名情况,以给自己更大的自信。思路 显然,这个题目实质上就是求解一个数N的所有因数的问题,所以我们首先会想到下面的方法:ArrayList<In...

2019-08-15 10:34:22 4529

原创 linux命令-----检查磁盘容量、cpu、内存使用率

1.磁盘容量 命令:df -h / | grep G | awk '{print $5}'2.cpu使用率 命令:top -bn 1 -i -c | grep %Cpu |awk '{print $8}'备注:这个是空闲cpu,使用率即:1-空闲*0.013.内存容量命令:free | grep Mem备注:total:...

2019-08-15 09:43:27 498

原创 python代码优化

1.字符串拼接 '+'拼接改为%s占位符拼接。 对于str2 = '哈哈哈哈'+str1,网上大牛这样说: '+'拼接:性能较差,因为 Python 中的字符串是不可变类型。用 “+” 号连接就相当于生成一个全新的字符串,生成字符串则需要重新申请内存,那么当用 "+ " 连接非常多个字符串时,将会很耗费内存,可能造成内存溢出。 %s占位...

2019-08-15 09:41:02 147

原创 C语言实现“八皇后问题”

八皇后是一个很经典的问题,通过回溯法可以很好解决,下面直接上代码。#include "stdio.h"#include "stdlib.h"int a[9]={0};int count=0; //计数器设置为全局变量int Check(int n){ //判断此状态是否符合 int i; for(i=1;i<n;i++) if((abs(a[i]-...

2017-11-09 23:26:46 264

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除