自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(22)
  • 资源 (8)
  • 收藏
  • 关注

原创 botpress搭建智能问答机器人

botpress搭建智能问答机器人一.下载botpress源码访问:https://github.com/botpress/botpress,下载最新的botpress源码二.本地安装依赖执行:yarninstall命令进行依赖包下载。如果出现python语法错误,如下:D:\\develop-environment\\botpress12.6\\node_modul...

2020-03-25 15:30:52 2987

原创 spacy安装中文库

第一步:spacy安装:pip install -U spacy第二步安装库:官方给出的英文库下载命令: python -m spacy download en_core_web_sm执行后会提示连接不上,无法下载,将命令改一下 用缩写python -m spacy download en可以成功下载!切记要用管理员身份运行!!!切记要用管理员身份运行!!!切记要用...

2019-07-11 19:37:59 7663 2

原创 python -m spacy dowmload en失败

使用spacy第一步先:spacy安装:pip install -U spacy第二步n库安装库安装python -m spacy download en这时候会出现一个错误:这时候改为管理员权限运行 可解决!...

2019-06-24 10:29:50 5434 1

原创 pip install textract 过程中报错

安装 textract 执行pip install textract过程中会报一个错Failed to build pocketsphinx 和command 'swig.exe' failed: No such file or directory先执行pip install pocketsphinx然后下载 swigwin-3.0.12解...

2019-06-21 12:38:40 830

原创 简单 快速 服务器之间传输文件

简单 快速 服务器之间传输文件首先,接收方10.0.82.196,启动接收, nc -l 9981 > file.tar.gz其次,发送方启动发送,nc 10.0.82.196 9981 < file.tar.gz完成传输

2021-11-08 14:20:35 412

原创 linux安装cudnn

linux安装cudnncuDNN的安装是建立在我们成功安装cuda的基础上的1.查看本地cuda版本nvcc -V2.找到对应版本的cuDNN下载。官网:https://developer.nvidia.com/rdp/cudnn-archive3.下载后上传到服务器。解压tar -xvf cudnn-11.3-linux-x64-v8.2.1.32.tar4.复制,授权cp cuda/include/cudnn.h /usr/local/cuda/includecp cuda/l

2021-09-24 17:22:10 2687 1

原创 crontab时间和系统时间不一致

crontab时间和系统时间不一致使用crontab做定时任务,如果是新服务器肯能会遇到这些问题,一.服务器时间设置输入:date 命令查看当前时间,如果时间对,直接跳过这一步。如果时间不对:1.需要先设置时区。用tzselect2.复制相应的时区文件,替换系统时区文件;cp /usr/share/zoneinfo/Asia/Shanghai /etc/localtime3.同时修改日期时间,注意要加双引号,日期与时间之间有一空格,输入:date -s "2007-08-03 14:15

2021-07-25 10:15:56 2662

原创 java基本数据类型和包装类怎么选择

一 java内存分配这里只是在网上找的一些资料;Java 中的数据类型分为基本类型(原始数据类型) byte short int long float double char boolean基本类型的变量持有原始值。符合数据类型(引用类型),引用类型持有引用值(即对某个对象的引用,而非对象本身)。一般Java在内存分配时会涉及到以下区域:寄存器:我们在程序中无法控制栈:存放基本类型的数据和对象的引用,但对象本身不存放在栈中,而是存放在堆中堆:存放用new产生的数据静态域:存放在对象

2021-06-16 16:57:23 261

原创 JAVA的Integer类理解

深入理解JAVA——(3)Integer类是基本数据类型int的包装类。为什么要用包装类?因为java的8大基本数据类型没有方法,所以要用对应的包装类丰富可使用的方法。顺便回忆一下java的8大基本数据类型:整型:byte, short, int, long字符型:char浮点型:float, double布尔型:boolean首先介绍构造方法:使用方法:Integer a = new Integer(10);Integer b = new Integer("10");官

2021-04-24 13:33:23 620

原创 JAVA的System类理解

深入理解JAVA——(2)System类是java.lang下的类,使用不需要导包提供了大量的静态方法,可以获取与系统相关的信息或系统操作,常用的有:public static long currentTimeMillis()返回毫秒值为单位的当前时间。public static void arraycopy(Object src, int srcPos, Object dest, int destPos, int length)将数组中指定的数据拷贝到另一个数组中。currentTimeM

2021-04-19 23:22:42 149

原创 JAVA的Object类理解

你真的理解JAVA了么——(1)Object类是所有类的父类,Object类的方法子类都有,下面介绍两个常用的。toString()方法A.作用:打印对象信息;Systen.out.print()打印对象默认调用对象的toString()方法。B.重写前:打印的是包名类名@地址;C.重写后:打印重写后的信息,一般打印对象属性;String类重写了该方法,返回的是本身内容equal方法:A.作用:比较两个对象;B.重写前:比较的是两个对象地址;本质等价于“==”C.重写后:比较的是对象

2021-04-13 23:49:59 235 4

原创 pdf文档解析相关工具包

pdf文档解析相关工具包pdf生成fdfgen: 能够自动创建pdf文档,并填写信息pdf表格解析pdftabextract: 用于OCR识别后的表格信息解析,很强大tabula-py: 直接将pdf中的表格信息转换为pandas的dataframe,有java和python两种版本代码pdfx: 自动抽取出引用参考文献,并下载对应的pdf文件invoice2data: 发票pdf信息抽取camelot: pdf表格解析pdfplumber: pdf表格解析pdf文档信息抽取pdf语义

2020-12-08 16:08:13 981 2

原创 python是单线程的,多线程有意义么

经常遇到小伙伴提到python是单线程的,写代码的时候用多线程没有意义,今天与大家分享一下关于python的单线程与多线程相关理解。首先 python是单线程的 这句话是不对的。这里要提到一个概念:Python的全局解释器锁(GIL)GIL是什么需要明确的一点是GIL并不是Python的特性,它是在实现Python解析器(CPython)时所引入的一个概念。就好比C++是一套语言(语法)标准,但是可以用不同的编译器来编译成可执行代码。有名的编译器例如GCC,INTEL C++,Visual C+

2020-10-09 17:29:38 5940 2

原创 用redigo操作redis过慢

go语言操作redis我选择了redogo框架,但使用过程中发现对redis的操作时长很长,比mysql都慢,不符合逻辑,最后发现需要更改连接池的空闲连接数连接池类Pool如下:type Pool struct { Dial func() (Conn, error) TestOnBorrow func(c Conn, t time.Time) error MaxIdle int MaxActive int IdleTimeout time.Duration

2020-07-29 17:21:27 520 1

原创 docke启动redis Mysql并挂载持久化

1.首先拉取redis镜像docker pull redis2.启动容器,加载配置文件并持久化数据docker run -d -p 6379:6379 --restart always -v /redis/conf/redis.conf:/etc/redis/redis.conf -v /redis/data:/data --name redis redis:latest redis...

2020-04-26 15:46:52 242

原创 git 拉取本公司gitlab服务区代码报错503

git 拉取本公司gitlab服务区代码报错503执行:$ git clone http://xxxxxxxxxxxxxxx.git显示:Cloning into 'xxxx'...显示:fatal: unable to access 'http://xxxxxxxxxxxxx/': The requested URL returned error: 503原因是我之前拉取github代...

2019-10-21 11:07:45 4512 1

原创 安装 使用 chatterbot

安装 chatterbotpip install chatterbot如果是python 3.7 安装会成功 使用会出现错误建议换成python3.6.4还是执行 pip install chatterbot如果遇到错误:PermissionError: [WinError 32] 另一个程序正在使用此文件,进程无法访问。: 'D:\\Users\\lixin159\\AppDat...

2019-09-06 16:04:20 1079

原创 linux ubuntu安装textract遇到的问题

背景介绍:我是在ubuntu镜像的容器内安装python3.6 pip3 然后代码里用到textract首先安装默认JRE / JDK安装Java的最简单的选择是使用与Ubuntu一起打包的版本。 具体来说,这将安装OpenJDK 8,最新和推荐的版本。首先,更新包索引。sudo apt-get update接下来,安装Java。 具体来说,此命令将安装Java运行时环境(JR...

2019-09-05 13:28:21 225

原创 用cocoNLP中pyhanlp提取邮箱,电话号码等错误“配置错误: 数据包不存在,请修改配置文件中的root”

用cocoNLP中的pyhanlp提起电话号码、邮箱、身份证号、手机号等时第一次使用。当运行from cocoNLP.extractor import extractor时,会下载hanlp的数据文件,这个文件比较大,一般都会下载失败,提示:配置错误: 数据包 D:/anaconda3/lib/site-packages/pyhanlp/static\data 不存在,请修改配置文件中...

2019-08-27 20:25:50 1183

原创 python 正则之提取字符串中的汉字,数字,字母

#\d 匹配一个数字字符。等价于 [0-9]#\D 匹配一个非数字字符。等价于 [^0-9]#过滤字符串中的英文与符号,保留汉字import rest = "hello,world!!%[545]你好234世界。。。"ste = re.sub("[A-Za-z0-9\!\%\[\]\,\。]", "", st)print(ste)#从字符串中提取数字totalCount = '...

2019-07-10 12:17:54 5839

原创 textract读取pdf文件时报错误 local variable 'pipe' referenced before assignment

textract读取pdf文件时报错误执行代码:text = textract.process(file_path, method='pdfminer', encoding='utf-8')报错: File "D:\anaconda3\lib\site-packages\textract\parsers\__init__.py", line 77, in process ret...

2019-07-09 10:04:06 697

原创 深度学习—自然语言处理—智能问答机器人

智能问答系统大体上可以分两类,比对问题类和生成答案类。 比对问题类就是拿着问题去与数据库中存储的所有问题进行对比,找到相似度最高的一个问题,然后将这个问题已存储的对应答案返回。这种方法简单,准确性也还可以。 生成答案类是利用LSTM网络,通过问题和答案进行训练一个模型,当输入新的问题时通过模型输出答案。这种方法难度比较大,往往生成的答案不通顺,不像人说的话,需要后续处理。 个人感觉现在市场上的大多数还是用对比问题的方法进行开发。

2019-06-14 11:06:04 2222

cudnn-10.0-linux-x64-v7.6.5.32.tar

linux。 cudnn 10.0版本

2021-09-24

Mac M1 配置安装的Docker.dmg

Mac M1 配置安装的Docker.dmg

2021-04-19

chinese_L-12_H-768_A-12.rar

bert中文模型,bert中文模型, bert中文模型, bert中文模型, bert中文模型,bert中文模型

2020-12-08

同义词表,反义词表,否定词表.zip

同义词表,反义词表,否定词表同义词表,

2020-12-04

中文停用词库整理.zip

分词词典: 综合了百度、搜狗等词库,以及手动整理的若干人名和新近出现的热词 中文停用词: 综合了"百度停用词表","哈工大停用词表","四川大学机器学习实验室停用词表"等若干停用词表,取交集并去除了不需要的标点符号和英文单词

2020-12-04

BERT_Paper_Chinese_Translation.zip

本资源完整的翻译了论文,并且给出了论文中所有引用资料的网络连接,方便对 BERT 感兴趣的朋友们进一步研究 BERT 中文模型:https://download.csdn.net/download/fangxiananvhai/13569863

2020-12-04

50万闲聊数据,闲聊库

数据包含小黄鸡闲聊数据,和自己整理的闲聊数据,闲聊问答数据等,如需要其他数据请联系我

2019-11-14

xx_ent_wiki_sm-2.1.0.rar

spacy的其他语料库

2019-07-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除