自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(16)
  • 收藏
  • 关注

原创 深度学习原理与TensorFlow实践3:数据读取

一、各种类型的数据形式及其对应使用的库csv、pkl(cPickle、Pickle)、json、xsl、html、xml —— pandasnpy、npz(多个npy的压缩)——numpyhdf —— 跨平台高校读写二、TFRecord数据处理1. 转化为tfrecords格式# csv->tfrecordsdef transform_to_tfrecord():...

2018-11-10 23:23:35 351

原创 深度学习原理与TensorFlow实践2:数据可视化模块——TensorBoard

一、原理从Tensorflow中所得的日志文件读取summary数据,然后将summary数据绘制成可视化图表。summary数据总共有5种。1. 标量数据  tf.summary.scalar2. 参数数据 tf.summary.histogram3. 图像数据 tf.summary.image4. 音频数据 tf.summary.audio5. 计算图结构 tf.sum...

2018-11-10 22:59:24 237

原创 深度学习原理与TensorFlow实践1:以分类问题入门Tensorflow

一、问题描述Titanic问题(具体问题可查看Kaggle平台)根据已有数据预测每位乘客是否幸存。共包含12个字段(或特征)。二、看做分类问题处理解决方案1. 数据读入及预处理(pandas、scikit-learn) *pandas可以读入各种类型的数据,读入的数据为DataFrame类型的对象。首先需要选择要选取的特征维数据,如果有大量的特征维,需要只留下某几个重要的特...

2018-11-10 21:54:50 442

原创 Adaboost

一、强可学习与弱可学习1.定义在PAC(概率近似正确)学习框架下,一个概念(一个类),如果存在一个多项式的学习算法能够学习,并且正确率很高,则为强可。反之,如果存在一个多项式学习算法能够学习,但正确率仅仅比随机猜测略好,则为弱可。2.定理在PAC学习框架下,一个概念是强可学习的充要条件是这个概念是弱可学习的。提升算法就是将一般的弱可学习模型构建组合而成强可学习模型。二、Ad...

2018-09-04 20:49:57 224

原创 支持向量机

一、支持向量机二类分类模型,定义在特征空间上间隔最大的线性分类器。二、线性可分支持向量机感知机利用误分类最小策略,求得分离超平面,这时的解有无穷多个。线性可分支持向量机利用间隔(几何间隔)最大化求最优分离超平面,解唯一。函数间隔:y(wx+b); 超平面关于某个点的函数间隔;超平面关于训练数据的函数间隔(所有点的最小值)。几何间隔:标准化的函数间隔三、线性支持向量机软间...

2018-09-04 18:50:55 168

原创 最大熵模型

一、最大熵原理理论基础:学习概率模型时,在所有可能的概率模型中,熵最大的模型是最好的模型。最大熵模型:在满足约束条件的模型集合中选取熵最大的模型。二、最大熵模型与逻辑斯蒂回归模型都是对数线性模型,模型学习就是在给定的训练数据条件下对模型进行极大似然估计或正则化的极大似然估计。是以似然函数为目标函数的最优化问题。似然函数的目标函数有很好的的性质,是光滑的凸函数,有多种方法可以找到...

2018-09-04 10:59:05 136

转载 图神经网络 The Graph neural network model

转载自https://www.cnblogs.com/shenliao/p/8960782.html1 图神经网络(原始版本)图神经网络现在的威力和用途也再慢慢加强 我从我看过的最原始和现在慢慢最新的论文不断写上我的看法和见解 本人出身数学 所以更喜欢数学推导   第一篇就介绍图神经网络想法的开端 之后的图神经网络模型 都是基于此慢慢改进。2 能处理的领域针对常见的旅行者问题 社交网络 分子结构 ...

2018-07-15 19:28:51 29280 3

原创 用于序列标注的CRF模型

set

2018-07-10 15:50:46 3856

原创 Linux:源代码到可执行文件(CRF++ python安装)

这一过程又称为编译软件源代码。编译是将源代码(程序语言描述)翻译成计算机处理器能识别的语言的过程。一 语言机器语言:数值代码,二进制指令。汇编语言:有一些符号高级编程语言二 编译程序语言有些程序可以直接运行,不需要编译,这些文件是用脚本或解释型语言编写的,例如Python/Ruby 。脚本语言由解释器的特殊程序执行。解释器负责输入程序文件并执行其所包含的所有指令。三 编译器gcc是linux环境中...

2018-07-10 15:50:18 541 1

原创 逻辑回归——最基础的线性逻辑回归详解

线性逻辑回归是最基础,也是最基本的线性模型,也就是说理解该模型,对于后续其他线性模型的研究有重要意义。所以今天找了时间专门回忆了一下。一、什么是回归,什么是逻辑回归?用一条直线对数据点进行拟合,拟合过程称为回归。Logistic回归:根据现有数据对分类边界线建立回归公式,以此进行分类。二、如何建立回归公式?我们使用Sigmoid函数建立回归公式,它的y值在(0,1)区间,符合分类需求。回归公式:构...

2018-06-08 22:25:39 1094

原创 正则表达式

《精通正则表达式》第五章:正则表达式的实用技巧TaggedText = re.compile("<([a-z0-9_]+)>([\w\W]+?)</([a-z0-9_]+)>|([^<>\s]+)", re.IGNORECASE)1.匹配连续行^\w+=.*(\\\n.*)* 不能匹配以反斜杠结尾的连续行文本.*包含\...

2018-06-04 20:00:57 118

转载 EMD

EMD算法简介该部分引用自[1]Earth Mover’s Distance (EMD),和欧氏距离一样,他们都是一种距离度量的定义,可以用来测量某分布之间的距离。EMD主要应用在图像处理和语音信号处理领域。EMD问题如下图所示给定两个签名(或者叫分布、特征量集合)P和Q,P为m个特征量Pi和其权重wPi的集合,记作P={(P1,wP1),(P2,wP2),...(Pm,wPm)},如图左侧部分。...

2018-05-08 18:42:46 11080

翻译 关系抽取经典论文理解——模式、统计学习

论文:A Novel Use of Statistical Parsing to Extract Information from text一、关系抽取关系抽取是在实体抽取基础上进行的。二、关系抽取步骤通用的句子处理步骤:词性标注、name finding、句法分析,经常局限在名词和动词组分块、语义分析,经常基于模式匹配。这样的一种处理弊端在于:前面步骤的错误很有可能会影响后面的步骤,没有反馈的操...

2018-05-04 16:03:09 1359

原创 Tensorflow基础

我把用Tensorflow搭建网络常见到的一些方法进行了整理。一、variable_scope它是一个定义了创建变量的操作的管理器,包含以下参数:name_or_scope: string or VariableScope: the scope to open.default_name: The default name to use if the name_or_scope argument i...

2018-04-28 12:30:36 355

原创 ruby基础——extend与include

module ClassMethods def cmethod "class method" endendmodule InstanceMethods def imethod "instance method" endendclass MyClass extend ClassMethods #追加类方法 include Ins

2016-09-20 16:55:58 391 3

原创 欢迎使用CSDN-markdown编辑器

ruby基础学习——类继承类的继承就是子类继承父类的所提供的一些功能,将子类共同使用的功能放在父类中,独有的功能才放在各自的子类。 class RingArray < Array def idx = i % size super(idx) #使用父类提供的方法 end endwday = RingArray[“星期一”,“星期二”,“星期三”,“星期四”,“星

2016-09-20 15:44:39 177

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除