摆渡者

我愿做你的摆渡者,即使只能把你送到岸

万卷书计划-2016年开启

万卷书计划从2016年开始,但之前所读的书在新浪博客记录着,从2019年开始转战CSDN上进行记录,之前的网址http://blog.sina.com.cn/s/blog_9b03e9eb0102wff2.html 2016年:26本 2017年:47本 2018年:36本 2019年 20...

2019-01-05 10:53:51

阅读数 97

评论数 0

python 内置函数

1、python获取当前字符串编码格式 chardet 安装:pip install chardet 在python2中,经常会遇到编码的问题,在python中有一个包可以打印出当前字符串的编码格式,具体的如下所示 import chardet print chardet.detect(h...

2018-08-15 14:54:43

阅读数 351

评论数 0

python包的安装

1、textblob TextBlob是一个用Python编写的开源的文本处理库。它可以用来执行很多自然语言处理的任务,比如,词性标注,名词性成分提取,情感分析,文本翻译,在windows下暗转命令如下所示: pip install -U textblob 2、tflearn pip in...

2018-08-07 09:58:04

阅读数 120

评论数 0

网址的收藏

https://hexo.io/zh-cn/ 博客搭建框架 https://zn1996.github.io/ http://localhost:7474 1、https://www.tinymind.cn/articles TinyMind 里面会有人工智能相关的最新消息 2、http...

2018-07-19 11:36:44

阅读数 250

评论数 1

BERT模型的输入

今天简单的介绍一下BERT的模型输入 上图显示的是BERT输入表示 总述:输入嵌入分别是token embeddings, segmentation embeddings 和position embeddings 的总和 BERT最主要的组成部分便是,词向量(token embedding...

2019-06-14 10:39:14

阅读数 41

评论数 0

BERT模型的输出

0、概述 想要获取获取bert模型的输出非常简单,使用 model.get_sequence_output()和model.get_pooled_output() 两个方法,但这两种方法针对NLP的任务需要进行一个选择 1、output_layer = model.get_sequence_ou...

2019-06-14 09:44:39

阅读数 70

评论数 0

python3 'ascii' codec can't encode character u'\uff08' in position 9: ordinal not in range(128)

这个是编码的问题 在python2版本中,需要在程序的开头部分加上下面的代码即可解决问题: # encoding=utf8 import sys reload(sys) sys.setdefaultencoding('utf8') 但是在python3版本中加上上面的代码则会报错,需要...

2019-05-30 11:19:25

阅读数 15

评论数 0

微软开源项目NeuronBlocks - 可视化

项目地址:https://github.com/Microsoft/NeuronBlocks 在下载位置的model_visualizer文件夹下面有相关的可视化的介绍 1、相关包的安装 首先进行相关包的安装: pip install graphviz pip install web.py...

2019-05-09 15:19:58

阅读数 137

评论数 0

微软开源项目NeuronBlocks - 像搭积木一样构建NLP深度学习模型

NeuronBlocks将常用的神经网络层封装为标准模块,通过配置简单的配置文件,就可以轻松构建复杂的深度神经网络模型,与此同时,工具包还提供了一些列针对常见NLP任务的经典模型 项目地址:https://github.com/Microsoft/NeuronBlocks 1、安装 Neur...

2019-05-07 16:10:17

阅读数 181

评论数 0

python调用各个分词包

目前分词的难点 (1)分词规范:公说公有理婆说婆有理 (2)歧义切分:歧义本身就是一个问题,暂时没有得到解决 (3)未登录词:语言是一个神奇的事情,总会有创意的人想出创意的词来表达特定的含义,而且这这个游戏乐此不疲,所以这个问题会一直都存在 接下来将python可能调用的分词包进行了汇总了(参照网...

2019-04-23 15:50:59

阅读数 41

评论数 0

linux下docker安装neo4j

之前是一直在windows下面进行neo4j的操作,但是会经常出现下面的问题,但一直没有解决这个问题 所以决定在公司的服务器上进行部署neo4j的环境 具体的部署如下所示: 1 从docker hub上面pull下最新的neo4j最新的镜像 linux下输入对应的命令: sudo ...

2019-04-20 10:19:41

阅读数 74

评论数 0

python 简单操作dbpedia

例子1 #coding:utf-8 from urllib.parse import quote import urllib import json import numpy as np # 输入实体指称项名称,返回对应实体(entity)的列表,json格式 # 格式http://shuya...

2019-04-16 15:35:49

阅读数 110

评论数 0

intellij连接postgresql数据库

1、打开IDLE,先点击Database,然后点击加号+ 2、点击加号标志,选择Data Source,在弹出选项中选择PostgreSQL数据库 3、信息的输入 Host:如果是本地的数据库,直接填入localhost,否则输入数据库的ip地址 User:用户名 4、测试 ...

2019-04-12 15:18:34

阅读数 296

评论数 1

TF-IDF的简单理解

1、TF-IDF简介 TF:Term Frequency 词频,指的是给定一个词在该文档中出现的次数 IDF:Inverse Document Frequency 逆文档频率 可以简单的理解成:一个词语在一篇文章中出现的次数越多,同时在其他的所有文档中出现的次数越少,越能够代表该文章2、TF ID...

2019-03-15 16:05:26

阅读数 150

评论数 0

psycopg2.ProgrammingError: permission denied for relation findlaw_a_copy

在postgresql中新copy了一个表,但是在python读数据库中,出现下面的错误 这个主要是新建的表没有设置权限 先查找所在数据库的角色名: select * from pg_roles 参看自己的数据库的rolename 执行下面的权限操作: GRANT ALL PRIVI...

2019-03-07 14:52:58

阅读数 242

评论数 0

数据库的基本操作

1、对已存在的表,进行添加列操作: alter table findlaw_q_copy add COLUMN key_word TEXT 2、连表查询 SELECT count(*) from findlaw_q_copy t1 WHERE t1.lawqaid not in(SELECT ...

2019-03-07 11:18:42

阅读数 38

评论数 0

ERROR: database "lawtime_backup" is being accessed by other users

PostgreSQL新建了一个数据库,进行删除时,遇到下面的问题: 直接执行: drop database数据库名 删除不了数据库 因为该数据库会有其他的用户在使用它,所以需要先断了所有的连接,再进行删除就可以了 select pg_terminate_backend(pid) from...

2019-03-07 10:56:52

阅读数 41

评论数 0

python操作Elasticsearc

1、简介 Elasticsearch本质上是一个分布式数据库,允许多台服务器协同工作,每台服务器可以运行多个Elasticsearch实例 单个Elasticsearch实例称为一个节点Node,一组节点构成一个集群Cluster Index Elasticsearch会索引所有字段,经处...

2019-02-25 19:33:36

阅读数 78

评论数 0

FastText的简单介绍

0、引言 FastText是facebook开源的一款集word2vec、文本分类等一体的机器学习训练工具。在之前的论文中,作者用FastText和char-CNN、deepCNN等主流的深度学习框架,在同样的公开数据集上进行对比测试,在保证准确率稳定的情况下,FastText在训练时间上,有着...

2019-01-25 14:22:42

阅读数 115

评论数 0

BERT:训练数据生成代码解读

1、简单介绍 预训练数据的预处理代码文件: create_pretraining_data.py 功能: 在这个py文件中,主要功能是生成训练数据 具体的训练命令如下所示: python create_pretraining_data.py \ --input_file=./sam...

2019-01-21 15:32:19

阅读数 852

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭