自定义博客皮肤

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

python 列表,数组,矩阵的相互转换

import numpy as np mylist = [[1, 2, 3], [4, 5, 6]] # 列表 print(type(mylist)) print(mylist, end='\n\n') myarray = np.array(mylist) # 列表转...

2019-08-30 16:19:54

阅读数 9

评论数 0

python返回某年某月的所有日期

import calendar def getMothDate(year, month): """ 返回某年某月的所有日期 :param year: :param month: :return: ""...

2019-08-27 11:21:46

阅读数 6

评论数 0

python读取千万行的mysql

import os import json import pymysql import logging import logging.handlers from database.database import * if __name__ == '__main__': conn = p...

2019-08-09 15:53:03

阅读数 19

评论数 0

Kafka教程(三)—— Python操作kafka

kafka的producer是支持多线程的因为其会把topic里面的消息存储在各个partition里面,可以多线程操作。但是consumer不支持多线程,如果多线程操作的话,会造成offset紊乱无序。下面我们从两部分来介绍python是如何操作kafka的。 第一部分是只有一个pos...

2019-08-02 17:43:03

阅读数 15

评论数 0

Kafka教程(二)—— Kafka安装与命令

一、ubutun18.04下Kafka安装 (1)安装jdk包 Apache Kafka是基于Java的,因此需要系统安装Java。执行以下命令,安装openJDK sudo apt update sudo apt install default-jdk (2)下载Apache ...

2019-08-02 17:14:18

阅读数 18

评论数 0

Kafka教程(一)—— Kafka基本原理介绍

本文会依次介绍kafka的介绍、特性、使用场景、基本概念、生产消费流程。因此前面遇到一些陌生的名词不要慌张,后面会介绍到。 一、Kafka基本介绍 Kafka是最初由Linkedin公司开发,是一个分布式、支持分区的(partition)、多副本的(replica),基于zookeep...

2019-08-02 16:24:01

阅读数 22

评论数 0

Docker教程(三)—— Docker三剑客与集群

一、Docker三剑客 (1)Docker compose Docker Compose是 Docker 官方编排(Orchestration)项目之一,负责快速的部署分布式应用。 先抛出链接,后续会根据个人经验详细阐述。 (2)Docker Machine Dock...

2019-07-29 11:40:41

阅读数 21

评论数 0

Docker教程(二)——操作

一、构建镜像 在构建docker镜像之前,需要指明,并不是所有的程序都需要自行通过Dockerfile构建镜像。Docker Hub上有大量的高质量的镜像可以用,我们可以直接pull下来这些镜像使用,详情可以参考链接。但是这些镜像大都是一些公共镜像,不能很好的符合业务定制化要求。故而我们...

2019-07-29 11:12:03

阅读数 12

评论数 0

Docker教程(一)——简介

一、Docker介绍 docker并不是一个能用一句话描述出来的技术,下面我会通过几个方面,介绍docker到底是个什么技术,有哪些用途和好处。 Docker是Google用go语言开发实现的,它基于linux内核的cgroup和namespace等技术,对进程进行了封装隔离。说白了D...

2019-07-26 16:58:37

阅读数 21

评论数 0

python3 读写csv

一、pandas写入csv 将dict写入csv文件 import pandas as pd list1 = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] pd.DataFrame(list1).to_csv...

2019-07-22 19:52:48

阅读数 25

评论数 0

redis学习

近期在用redis做消息队列的分发,故而把近期了解到的redis用法稍作整理。 一、安装redis linux系统中可以直接通过命令来安装redis,很方便。但是安装过程中会报错 No apport report written because the error message ...

2019-07-22 18:49:01

阅读数 9

评论数 0

python3 时间格式转换

废话不多说,直接上代码,关于python3中时间戳、datetime、str的转换,以及两个时间的时间间隔计算方式等。 import time import datetime release_time = 1558426818 # 将时间戳转换为datetime date_time = ...

2019-05-27 14:12:41

阅读数 237

评论数 0

AHP层次分析法—特征权重初始化

最近在做电商知识图谱,涉及一些商品评分,店铺GMV的计算。这些结果是由一些特征加权计算得到,因此如何初始化特征的权重就显得尤为重要。如果一味的按照经验去进行初始化权重,然后不停的A/B测试,权重调整,是一件研发成本特别高的事情。故我选用AHP来对特征权重进行初始化。 一、AHP简介 ...

2019-05-21 12:26:30

阅读数 81

评论数 0

【PyTorch系列教程一】深度学习框架及Tensor的基本介绍

一、深度学习框架比较 深度学习的基本介绍在这里就不做过多介绍,感兴趣的童鞋可以在网上搜索,有很多这方面的知识。本博只是介绍一些基本的深度学习开发框架。 下图为7个深度学习框架的比较,字体比较小,大家可以放大观看。 除此之外,还有一些其他的深度学习开发框架,比如百...

2019-04-15 10:43:35

阅读数 53

评论数 0

拥抱Transformer,图解NLP处理流程四部曲

一、Transformer简介 Transformer是google团队在2017年提出来的,它的问世刷新了一系列NLP竞赛的结果,现在也成为各大NLP爱好者的首选结构,诸如ELMO、Bert等超牛的model都是在transform的思想上实现的。 Transforme...

2019-03-14 19:58:38

阅读数 872

评论数 2

知识图谱—关系抽取—远程监督—综述(二)

此文章接上一篇关系抽取OpenNRE。 一、PCNN+MIL PCNN全称是Piece Wise CNN,是在CNN基础上通过修改Pooling的方式得到的。 输入仍然是一个sentence,Input Layer依然是word embedding + position embe...

2019-03-07 12:04:48

阅读数 671

评论数 0

多示例学习(Multiple Instance Learning)

多示例学习(multiple-instance learning)是1997年被提出的。其与监督学习、半监督学习和非监督学习有所不同,它是以多示例包(bag)为训练单元的学习问题。 在多示例学习中,训练集由一组具有分类标签的多示例包(bag)组成,每个多包(bag)含有若干个没有分类标签...

2019-03-07 10:41:24

阅读数 970

评论数 0

BERT简述

本文从词嵌入出发,一步步介绍Bert出现的背景,故文章前一部分的介绍可能与Bert的相关性不强,但是必不可少。 1、词向量        词向量一直是领先的NLP模型处理语言的主要能力。Word2Vec、Glove等方法已广泛应用于此类任务。让我们先回顾一下如何使用它们。         对...

2018-12-27 11:11:41

阅读数 632

评论数 0

Transform中的Attention注意力机制

本文边讲细节边配合代码实战,代码地址为: https://github.com/princewen/tensorflow_practice/tree/master/basic/Basic-Transformer-Demo 数据地址为:https://pan.baidu.com/s/14Xfpr...

2018-12-20 11:16:23

阅读数 1903

评论数 3

知识图谱—关系抽取—远程监督—OpenNRE(一)

一、远程监督简介 远程监督的英文名称Distant Supervision,是目前关系抽取中比较常见的一类做法。该方法由 M Mintz 大佬于ACL2009上首次提出,它既不是单纯的传统意义上的监督语料,当然也不是无监督。它是一种用KB去对齐朴素文本的标注方法(Distant supe...

2018-12-14 13:24:52

阅读数 4350

评论数 1

提示
确定要删除当前文章?
取消 删除