版本控制神器之Git学习指南

网上有很多介绍Git的使用方法的,良莠不齐,初学者很难分辨。我找到了一个学习网站,包括了多种语言的教程,还提供下载版本,非常赞,几乎可以说是零基础入门了! 推荐给大家: https://git-scm.com/book/zh/v2 感谢社区的倾情奉献!!! ...

2019-05-16 20:02:37

阅读数 1

评论数 0

在无网centos中简易部署python环境

1 准备阶段 为了模拟真实的环境,我用docker从官方仓库pull下来了一个centos系统,然后安装了python3.6.0。 1.1 创建容器 利用docker images查看所有的镜像; 根据镜像的名字,如centos,创建容器,注意容器要有交互的shell,因此命令为:docker ...

2019-05-02 16:35:42

阅读数 27

评论数 0

windows7使用docker记录——传递本机文件到某个容器

windows7使用docker的话,推荐安装Docker Toolbox。安装完成之后桌面会出现“Oracle VM VirtualBox”,“Kitematic(Alpha)”和“Docker Quickstart”三个图标。 第一步,配置共享文件夹 双击Oracle VM VirtualBo...

2019-04-30 15:02:14

阅读数 21

评论数 0

python中自定义module的方法及注意事项

https://www.cnblogs.com/kex1n/p/5977051.html 在编写python程序的过程中,不可避免的需要自定义一些python的类和函数。有时候定义的函数太多,就要根据用途放到不同的module(模块)中去,项目更大时,需要将这些module再分类,放到不同的pac...

2019-04-23 17:30:39

阅读数 20

评论数 0

维特比算法整理(参考《数学之美》)

解决问题:篱笆网络中的最短路径 XijX_{ij}Xij​表示第iii个时刻的第jjj个可能值,其中,1≤i≤d1\leq i\leq d1≤i≤d;每个时刻可能的取值个数分别为n1,n2,…,ndn_1,n_2,…,n_dn1​,n2​,…,nd​;算法目标为从S开始,找到一条路径到E,使得路...

2019-01-08 17:51:19

阅读数 93

评论数 0

在Windows下离线安装pyhanlp

HanLP是一款优秀的中文自然语言处理工具,可以实现包括分词、词性标注、实体识别在内容诸多功能,详情见其项目主页。另外,该工具包还提供了python3的接口,在线安装很方便,但有时需要部署在内网机等没有网络环境的机器上,比较繁琐,整理步骤如下: 安装jpype1,这是pyhanlp的依赖包,可以...

2018-12-20 11:40:07

阅读数 424

评论数 0

布隆过滤器

我们要去判断一堆元素里面是不是存在某一个特定的元素,最直观的想法就是,遍历给定的元素集合,然后判断是否存在某个(些)元素与要检查的元素相等。这在数据量相对很小的时候没有问题,而随着数据量的增大,再用这种方式去存储该集合就会对内存提出较高的要求。 ...

2018-11-17 22:05:34

阅读数 61

评论数 0

ORACLE/MYSQL数据库的常用SQL命令

ORACLE数据库 以下均是在创建一个成功的连接后的操作。 1. 返回某个数据库(模式)中所有表的基本信息: select * from all_tables where owner='yourschema' -- 将yourschema换成指定的数据库名称 select t...

2018-11-13 11:02:02

阅读数 1266

评论数 1

pandas.DataFrame写入数据库的操作

以mysql数据库为例,需要导入包pymysql。 假设我们已经创建了一个df,现在将其导入数据库中,写法如下: import pymysql import pandas as pd from sqlalchemy import create_engine #建立连接,username替换为用...

2018-11-01 09:13:31

阅读数 1200

评论数 0

Linux常用命令

tail -f run.log,用于动态查看run.log的写入内容 touch new.txt,创建一个新的文件

2018-10-24 11:40:12

阅读数 61

评论数 0

Linux命令行样式的设置

VM虚拟机中安装的CentOS 7系统下的操作 1.命令行样式的设置 默认的命令行及命令的执行结果,都是黑底白字或者白底黑字,当输出的结果很多时,要在多行的结果中找到命令的起始位置,是非常麻烦的。因此,我在装好linux系统后,第一件事就是更改命令行的格式。 在输入linux命令的时候,分为普...

2018-10-22 17:09:49

阅读数 68

评论数 0

双向长短记忆网络(BiLSTM)

关于理解LSTM的一篇英文博客非常经典,可以去这里阅读,本文也参考了该博文。 循环神经网络(RNN) BiLSTM是RNN的一种延伸,因此,要理解BiLSRM就必须首先弄明白什么是RNN。 普通神经网络的局限 假设我们对于普通的神经网络模型已经比较熟悉,那么不难理解,在神经网络的某一固定层中,...

2018-10-13 17:43:23

阅读数 2526

评论数 0

循环中的pass、continue以及break

说明 pass、continue以及break常用于控制循环的运行。它们的功能如下: pass:即“通过”的意思,程序运行至pass处会继续运行后续的部分 continue:即“继续”的意思,程序运行至continue处将不再运行其下方的同级代码,而是运行continue所在的最底层循环体的下一...

2018-10-08 12:52:00

阅读数 77

评论数 0

知识图谱学习系列之二:命名实体识别1(技术及代码)

命名实体识别,Named Entity Recognition,简称NER。指的是构建合适的模型,从给定的数据(常常是文本)中得到所需实体的过程。 什么是命名实体 命名实体指的就是所有以名称来作为标识的实体。在有的资料中,将命名实体分为三大类(实体类、时间类和数字类...

2018-09-10 16:51:12

阅读数 1522

评论数 2

条件随机场简介

一篇英文博客的翻译版本,详情请戳原文。 假如你可以得到Justin Bieber日常一天的连续快照,然后你想根据Justin Bieber正在进行的活动(吃饭、睡觉、开车等)对这些照片进行分类,那么你该怎么做呢? 一种方法就是,忽略照片之间的关系,建立并训练一个接收单一照片的分类器。比...

2018-09-07 18:31:37

阅读数 288

评论数 0

知识图谱学习系列之一:知识图谱综述

知识图谱技术最早为谷歌所提出,随后在其搜索引擎中上线一系列产品。即使假设是谷歌首次提出这一概念,至今也有很长时间了,网上已经有了很多介绍知识图谱相关内容的文章,笔者出于对自身学习过程的梳理和对自身工作的反思总结,写出这一系列笔记,如能帮助来者,实在不胜感激。 根据个人学习习惯,只有从宏观角度把...

2018-08-05 16:18:33

阅读数 1558

评论数 0

Python中类和实例学习笔记

Python中类和实例学习笔记 以创建一个命名实体识别(Named Entity Recognition,NER)模型为例,学习Python中类和实例的相关内容。 类(Class)和实例(Instance) 类和实例是面向对象编程最重要的概念之二,类是抽象的模板,实例是类的具体表...

2018-07-30 20:32:54

阅读数 202

评论数 0

统计学中“最简单”的Bootstrap方法介绍及其应用

最近的论文写作中,需要用到Bootstrap方法,即所谓的“自举法”、“靴带法”。Bootstrap在英语中作为一个名词的话,其的意思是“拔靴带”,也就是通过自身的 力量,自己把自己抬起来。注意这个限定——“通过自身的力量”——这是Bootstrap方法的核心所在。本篇博文旨在根据自身的实际工作,...

2018-01-25 15:34:42

阅读数 9810

评论数 1

提示
确定要删除当前文章?
取消 删除
关闭
关闭