- 博客(22)
- 资源 (8)
- 收藏
- 关注
原创 botpress搭建智能问答机器人
botpress搭建智能问答机器人一.下载botpress源码访问:https://github.com/botpress/botpress,下载最新的botpress源码二.本地安装依赖执行:yarninstall命令进行依赖包下载。如果出现python语法错误,如下:D:\\develop-environment\\botpress12.6\\node_modul...
2020-03-25 15:30:52 2987
原创 spacy安装中文库
第一步:spacy安装:pip install -U spacy第二步安装库:官方给出的英文库下载命令: python -m spacy download en_core_web_sm执行后会提示连接不上,无法下载,将命令改一下 用缩写python -m spacy download en可以成功下载!切记要用管理员身份运行!!!切记要用管理员身份运行!!!切记要用...
2019-07-11 19:37:59 7663 2
原创 python -m spacy dowmload en失败
使用spacy第一步先:spacy安装:pip install -U spacy第二步n库安装库安装python -m spacy download en这时候会出现一个错误:这时候改为管理员权限运行 可解决!...
2019-06-24 10:29:50 5434 1
原创 pip install textract 过程中报错
安装 textract 执行pip install textract过程中会报一个错Failed to build pocketsphinx 和command 'swig.exe' failed: No such file or directory先执行pip install pocketsphinx然后下载 swigwin-3.0.12解...
2019-06-21 12:38:40 830
原创 简单 快速 服务器之间传输文件
简单 快速 服务器之间传输文件首先,接收方10.0.82.196,启动接收, nc -l 9981 > file.tar.gz其次,发送方启动发送,nc 10.0.82.196 9981 < file.tar.gz完成传输
2021-11-08 14:20:35 412
原创 linux安装cudnn
linux安装cudnncuDNN的安装是建立在我们成功安装cuda的基础上的1.查看本地cuda版本nvcc -V2.找到对应版本的cuDNN下载。官网:https://developer.nvidia.com/rdp/cudnn-archive3.下载后上传到服务器。解压tar -xvf cudnn-11.3-linux-x64-v8.2.1.32.tar4.复制,授权cp cuda/include/cudnn.h /usr/local/cuda/includecp cuda/l
2021-09-24 17:22:10 2687 1
原创 crontab时间和系统时间不一致
crontab时间和系统时间不一致使用crontab做定时任务,如果是新服务器肯能会遇到这些问题,一.服务器时间设置输入:date 命令查看当前时间,如果时间对,直接跳过这一步。如果时间不对:1.需要先设置时区。用tzselect2.复制相应的时区文件,替换系统时区文件;cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime3.同时修改日期时间,注意要加双引号,日期与时间之间有一空格,输入:date -s "2007-08-03 14:15
2021-07-25 10:15:56 2662
原创 java基本数据类型和包装类怎么选择
一 java内存分配这里只是在网上找的一些资料;Java 中的数据类型分为基本类型(原始数据类型) byte short int long float double char boolean基本类型的变量持有原始值。符合数据类型(引用类型),引用类型持有引用值(即对某个对象的引用,而非对象本身)。一般Java在内存分配时会涉及到以下区域:寄存器:我们在程序中无法控制栈:存放基本类型的数据和对象的引用,但对象本身不存放在栈中,而是存放在堆中堆:存放用new产生的数据静态域:存放在对象
2021-06-16 16:57:23 261
原创 JAVA的Integer类理解
深入理解JAVA——(3)Integer类是基本数据类型int的包装类。为什么要用包装类?因为java的8大基本数据类型没有方法,所以要用对应的包装类丰富可使用的方法。顺便回忆一下java的8大基本数据类型:整型:byte, short, int, long字符型:char浮点型:float, double布尔型:boolean首先介绍构造方法:使用方法:Integer a = new Integer(10);Integer b = new Integer("10");官
2021-04-24 13:33:23 620
原创 JAVA的System类理解
深入理解JAVA——(2)System类是java.lang下的类,使用不需要导包提供了大量的静态方法,可以获取与系统相关的信息或系统操作,常用的有:public static long currentTimeMillis()返回毫秒值为单位的当前时间。public static void arraycopy(Object src, int srcPos, Object dest, int destPos, int length)将数组中指定的数据拷贝到另一个数组中。currentTimeM
2021-04-19 23:22:42 149
原创 JAVA的Object类理解
你真的理解JAVA了么——(1)Object类是所有类的父类,Object类的方法子类都有,下面介绍两个常用的。toString()方法A.作用:打印对象信息;Systen.out.print()打印对象默认调用对象的toString()方法。B.重写前:打印的是包名类名@地址;C.重写后:打印重写后的信息,一般打印对象属性;String类重写了该方法,返回的是本身内容equal方法:A.作用:比较两个对象;B.重写前:比较的是两个对象地址;本质等价于“==”C.重写后:比较的是对象
2021-04-13 23:49:59 235 4
原创 pdf文档解析相关工具包
pdf文档解析相关工具包pdf生成fdfgen: 能够自动创建pdf文档,并填写信息pdf表格解析pdftabextract: 用于OCR识别后的表格信息解析,很强大tabula-py: 直接将pdf中的表格信息转换为pandas的dataframe,有java和python两种版本代码pdfx: 自动抽取出引用参考文献,并下载对应的pdf文件invoice2data: 发票pdf信息抽取camelot: pdf表格解析pdfplumber: pdf表格解析pdf文档信息抽取pdf语义
2020-12-08 16:08:13 981 2
原创 python是单线程的,多线程有意义么
经常遇到小伙伴提到python是单线程的,写代码的时候用多线程没有意义,今天与大家分享一下关于python的单线程与多线程相关理解。首先 python是单线程的 这句话是不对的。这里要提到一个概念:Python的全局解释器锁(GIL)GIL是什么需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念。就好比C++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码。有名的编译器例如GCC,INTEL C++,Visual C+
2020-10-09 17:29:38 5940 2
原创 用redigo操作redis过慢
go语言操作redis我选择了redogo框架,但使用过程中发现对redis的操作时长很长,比mysql都慢,不符合逻辑,最后发现需要更改连接池的空闲连接数连接池类Pool如下:type Pool struct { Dial func() (Conn, error) TestOnBorrow func(c Conn, t time.Time) error MaxIdle int MaxActive int IdleTimeout time.Duration
2020-07-29 17:21:27 520 1
原创 docke启动redis Mysql并挂载持久化
1.首先拉取redis镜像docker pull redis2.启动容器,加载配置文件并持久化数据docker run -d -p 6379:6379 --restart always -v /redis/conf/redis.conf:/etc/redis/redis.conf -v /redis/data:/data --name redis redis:latest redis...
2020-04-26 15:46:52 242
原创 git 拉取本公司gitlab服务区代码报错503
git 拉取本公司gitlab服务区代码报错503执行:$ git clone http://xxxxxxxxxxxxxxx.git显示:Cloning into 'xxxx'...显示:fatal: unable to access 'http://xxxxxxxxxxxxx/': The requested URL returned error: 503原因是我之前拉取github代...
2019-10-21 11:07:45 4512 1
原创 安装 使用 chatterbot
安装 chatterbotpip install chatterbot如果是python 3.7 安装会成功 使用会出现错误建议换成python3.6.4还是执行 pip install chatterbot如果遇到错误:PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问。: 'D:\\Users\\lixin159\\AppDat...
2019-09-06 16:04:20 1079
原创 linux ubuntu安装textract遇到的问题
背景介绍:我是在ubuntu镜像的容器内安装python3.6 pip3 然后代码里用到textract首先安装默认JRE / JDK安装Java的最简单的选择是使用与Ubuntu一起打包的版本。 具体来说,这将安装OpenJDK 8,最新和推荐的版本。首先,更新包索引。sudo apt-get update接下来,安装Java。 具体来说,此命令将安装Java运行时环境(JR...
2019-09-05 13:28:21 225
原创 用cocoNLP中pyhanlp提取邮箱,电话号码等错误“配置错误: 数据包不存在,请修改配置文件中的root”
用cocoNLP中的pyhanlp提起电话号码、邮箱、身份证号、手机号等时第一次使用。当运行from cocoNLP.extractor import extractor时,会下载hanlp的数据文件,这个文件比较大,一般都会下载失败,提示:配置错误: 数据包 D:/anaconda3/lib/site-packages/pyhanlp/static\data 不存在,请修改配置文件中...
2019-08-27 20:25:50 1183
原创 python 正则之提取字符串中的汉字,数字,字母
#\d 匹配一个数字字符。等价于 [0-9]#\D 匹配一个非数字字符。等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字import rest = "hello,world!!%[545]你好234世界。。。"ste = re.sub("[A-Za-z0-9\!\%\[\]\,\。]", "", st)print(ste)#从字符串中提取数字totalCount = '...
2019-07-10 12:17:54 5839
原创 textract读取pdf文件时报错误 local variable 'pipe' referenced before assignment
textract读取pdf文件时报错误执行代码:text = textract.process(file_path, method='pdfminer', encoding='utf-8')报错: File "D:\anaconda3\lib\site-packages\textract\parsers\__init__.py", line 77, in process ret...
2019-07-09 10:04:06 697
原创 深度学习—自然语言处理—智能问答机器人
智能问答系统大体上可以分两类,比对问题类和生成答案类。 比对问题类就是拿着问题去与数据库中存储的所有问题进行对比,找到相似度最高的一个问题,然后将这个问题已存储的对应答案返回。这种方法简单,准确性也还可以。 生成答案类是利用LSTM网络,通过问题和答案进行训练一个模型,当输入新的问题时通过模型输出答案。这种方法难度比较大,往往生成的答案不通顺,不像人说的话,需要后续处理。 个人感觉现在市场上的大多数还是用对比问题的方法进行开发。
2019-06-14 11:06:04 2222
中文停用词库整理.zip
2020-12-04
BERT_Paper_Chinese_Translation.zip
2020-12-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人