自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(132)
  • 资源 (3)
  • 收藏
  • 关注

原创 账号竟然被盗了,搬家到简书

如题

2017-09-16 16:21:59 618

转载 tensorflow可视化tensorboard “No graph definition files were found.” 错误

个人觉得tensorflow相对于其它的深度学习库来说是比较好安装的,本人一开始安装theano弄了好几天也没安装好,最后没办法就安装的tensorflow,竟然一点问题也没出,一次性就安装好了,冲这个本人也看好tensorflow。tensorflow支持windows系统,但Python版本要在python3以上,python3和python2还是有挺多区别的,用的时候要注意。本人用的是win

2017-08-23 23:14:02 634

转载 关联规则挖掘:基本概念

本文主要来自《数据仓库和数据挖掘》一书,这本书讲的和维基百科里的非常相似,怀疑是从某本外文书籍里翻译过来的。关联规则挖掘(Association rule mining)是数据挖掘中最活跃的研究方法之一,可以用来发现事情之间的联系,最早是为了发现超市交易数据库中不同的商品之间的关系。这里有一则沃尔玛超市的趣闻。沃尔玛曾今对数据仓库中一年多的原始交易数据进行了详细的分析,发现与尿布一起被

2017-08-13 18:35:36 3468

原创 HMM和CRF简单推导

2017-08-05 13:19:17 1122

原创 对spark mlib的Pipeline的理解

参考博客:sparkmlib使用Pipeline实现简单的逻辑回归Pipeline详解及Spark MLlib使用

2017-08-02 16:20:12 419

原创 Intellij IDEA搭建Spark开发环境并运行

在IntellIJ IDEA中搭建好spark开发环境,并在IntelliJ IDEA中运行local模式,这是学习spark开发和调试spark程序,以及分析spark源码的绝佳方式.基本流程:1.安装JDK,注意版本要和spark兼容2.安装scala,注意版本要和spark兼容3.安装IntelliJ IDEA 并安装scala插件4.新建scala工程,制定JDK,和s

2017-08-02 11:34:59 1176

翻译 Spark SQL, DataFrames and Datasets Guide

概述:Spark SQL是用于结构化数据处理的Spark模块。 与基本的Spark RDD API不同,Spark SQL提供的接口为Spark提供了有关正在执行的数据和计算结构的更多信息。 在内部,Spark SQL使用这些额外的信息执行额外的优化。 有几种与Spark SQL进行交互的方法,包括SQL和Dataset API。 当计算结果时,使用相同的执行引擎,独立于您用来表达计算的API

2017-07-25 10:19:42 590

原创 基于排序学习的推荐算法研究综述

概述:排序学习技术尝试用机器学习的方法解决排序问题,已被深入研究并广泛应用于不同的领域,如信息检索、文本挖掘、个性化推荐、生物医学等。将排序学习融入推荐算法中,研究如何整合大量用户和物品的特征,构建更加贴合用户偏好需求的用户模型,以提高推荐算法的性能和用户满意度,成为基于排序学习推荐算法的主要任务。对近些年基于排序学习的推荐算法研究进展进行综述,并对其问题定义、关键技术、效用评价、应用进展等进

2017-07-20 14:57:21 1643

原创 计算糖果

A,B,C三个人是好朋友,每个人手里都有一些糖果,我们不知道他们每个人手上具体有多少个糖果,但是我们知道以下的信息:A - B, B - C, A + B, B + C. 这四个数值.每个字母代表每个人所拥有的糖果数.现在需要通过这四个数值计算出每个人手里有多少个糖果,即A,B,C。这里保证最多只有一组整数A,B,C满足所有题设条件。 输入描述:输入为一行,一共4个整数,分别为

2017-07-20 12:46:14 133

原创 回文序列

如果一个数字序列逆置之后跟原序列是一样的就称这样的数字序列为回文序列。例如:{1, 2, 1}, {15, 78, 78, 15} , {112} 是回文序列, {1, 2, 2}, {15, 78, 87, 51} ,{112, 2, 11} 不是回文序列。现在给出一个数字序列,允许使用一种转换操作:选择任意两个相邻的数,然后从序列移除这两个数,并用这两个数字的和插入到这两个数之

2017-07-20 11:25:52 1939

原创 分类器指标-准确率,精度,召回率

2017-07-16 00:47:03 1387

原创 SVM合页损失函数

参考:《统计学习方法》

2017-07-15 17:50:42 9546 6

原创 一道练习题

题目:小明向他的女朋友仙仙求婚,在求婚戒指上刻了一个大大的爱心。仙仙看到爱心想考验一下小明,出了一道题。方程(x2+y2−1)2−x2y2=0能画出一个美丽的爱心,现在给定一个点(x,y),其中,X∼N((μ1,σ21),Y∼N((μ2,σ22),这个点在这个爱心里面的概率是多少,精确到0.1(小数点后保留一位小数,比如0.1, 0.2等)import java.util.*;

2017-07-14 18:03:49 707

翻译 文本挖掘的简要综述:分类,聚类和提取技术

摘要:每天生成的文字数量急剧增加。 大量非结构化文本的大量数据不能被计算机简单地处理和感知。 因此,需要有效且高效的技术和算法来发现有用的模式。 文本挖掘是从文本中提取有意义的信息,近年来受到了大量的关注。 在本文中,我们描述了几个最基本的文本挖掘任务和技术,包括文本预处理,分类和聚类。 此外,我们还介绍了生物医学和保健领域的文本挖掘。

2017-07-12 11:19:37 1587

原创 [总结]机器学习中用到的线性代数公式,看完这个就够了

Backpropagation for a Linear LayerVector, Matrix, and Tensor Derivatives

2017-07-09 17:27:16 1108

转载 java中的基本数据类型一定存储在栈中吗?

首先说明,"java中的基本数据类型一定存储在栈中的吗?”这句话肯定是错误的。   下面让我们一起来分析一下原因:   基本数据类型是放在栈中还是放在堆中,这取决于基本类型在何处声明,下面对数据类型在内存中的存储问题来解释一下:   一:在方法中声明的变量,即该变量是局部变量,每当程序调用方法时,系统都会为该方法建立一个方法栈,其所在方法中声明的变量就放在方法栈中,当方

2017-07-05 17:25:39 593

转载 单项链表查找、相交或成环的几个算法

这篇文章介绍了单项链表上有关相交和成环的几个问题和算法。你也可以参考有关单项链表的另外几篇文章:单项链表实现的栈反转单项链表的四种算法1.判断两个单项链表是否相交1.1.问题描述给定两个单向链表,判断链表是否相交(有共同的节点)。1.2.算法一最直接的解法,就是对其中一个链表(链表一)进行遍历,在遍历到每一个节点时,都在另一个链表(链

2017-07-05 12:11:17 460

原创 基于微博用户标签的中医药情绪分析

1. 主要内容收集语料库和字典资源,根据用户标签自动标注数据,构建支持向量机(SVM)分类器,预测人们对中医药(Traditional Chinese Medicine ,TCM)的情绪,并提出调整分类器结果的方法,获得的F-measure的性能是97%。2. 数据收集和打标记(1) 对中医药感兴趣用户识别:微波用户可以自己设置兴趣标签,筛选出下表Table 1 的类似标签

2017-07-01 23:21:52 919

原创 贪心2-- Largest Rectangle in Histogram(LeetCode84)

Given n non-negative integers representing the histogram's bar height where the width of each bar is 1, find the area of largest rectangle in the histogram.Above is a histogram where width o

2017-06-28 21:04:05 275

原创 贪心1 Wiggle Subsequence(LeetCode376)

376. Wiggle SubsequenceA sequence of numbers is called a wiggle sequence if the differences between successive numbers strictly alternate between positive and negative. The first difference (if

2017-06-28 19:36:10 262

原创 深度优先-leetcode77 组合

Given two integers n and k, return all possible combinations of k numbers out of 1 ... n.For example,If n = 4 and k = 2, a solution is:[ [2,4], [3,4], [2,3], [1,2], [1,3], [1,4],]

2017-06-23 13:53:18 258

原创 深度优先-Leetcode46 全排列

Given a collection of distinct numbers, return all possible permutations.For example, [1,2,3] have the following permutations: [1,2,3], [1,3,2], [2,1,3], [2,3,1], [3,1,2], and [3,2,1].深度优先

2017-06-23 12:55:06 273

原创 JAVA面向对象特性

JAVA面向对象特性:懒惰、急躁、傲慢是程序员的三大美德——Larry Wall,“ Programming Perl”– 懒惰使你尽你所能减少能量的损耗,你会致力于写出不需要付出很大体力的,并且让他人能够   觉得好用的代码,你会为你的代码写出文档来避免回答他人关于你的代码的问题– 急躁:当电脑懒惰的时候你感到愤怒,这使你不是写程序来应对需求,而是写出程序程序能够   处

2017-06-04 18:13:06 254

原创 JAVA的面向对象特性

JAVA面向对象特性:懒惰、急躁、傲慢是程序员的三大美德——Larry Wall,“ Programming Perl”– 懒惰使你尽你所能减少能量的损耗,你会致力于写出不需要付出很大体力的,并且让他人能够  觉得好用的代码,你会为你的代码写出文档来避免回答他人关于你的代码的问题– 急躁:当电脑懒惰的时候你感到愤怒,这使你不是写程序来应对需求,而是写出程序程序能够  处理可

2017-06-04 18:10:45 195

原创 JAVA异常及处理

Java 中的异常什么是异常?– Java中所有的异常都是Throwable类的子类– 异常是Java程序用来指示一个错误信息的事件– Java中的异常分为两大类:• Error——系统异常,这类异常通常不是程序员或者用户可以控制的,例如OutOfMemoryError,内存不足错误,或者我们以前看到过的堆栈溢出错误– 这类异常通常不需要捕获,在运行中遇到这类情况的

2017-06-04 17:31:33 324

原创 JAVA中的异常及处理

Java 中的异常什么是异常?– Java中所有的异常都是Throwable类的子类– 异常是Java程序用来指示一个错误信息的事件– Java中的异常分为两大类:• Error——系统异常,这类异常通常不是程序员或者用户可以控制的,例如OutOfMemoryError,内存不足错误,或者我们以前看到过的堆栈溢出错误– 这类异常通常不需要捕获,在运行中遇到这类情况的

2017-06-04 17:22:34 309

转载 基于LSTM搭建一个文本情感分类的深度学习模型:准确率往往有95%以上

基于情感词典的文本情感分类传统的基于情感词典的文本情感分类,是对人的记忆和判断思维的最简单的模拟,如上图。我们首先通过学习来记忆一些基本词汇,如否定词语有“不”,积极词语有“喜欢”、“爱”,消极词语有“讨厌”、“恨”等,从而在大脑中形成一个基本的语料库。然后,我们再对输入的句子进行最直接的拆分,看看我们所记忆的词汇表中是否存在相应的词语,然后根据这个词语的类别来判断情感,比如“我喜

2017-05-27 16:46:38 58175 25

基于情感词典的文本情感分类传统的基于情感词典的文本情感分类,是对人的记忆和判断思维的最简单的模拟,如上图。我们首先通过学习来记忆一些基本词汇,如否定词语有“不”,积极词语有“喜欢”、“爱”,消极词语有“讨厌”、“恨”等,从而在大脑中形成一个基本的语料库。然后,我们再对输入的句子进行最直接的拆分,看看我们所记忆的词汇表中是否存在相应的词语,然后根据这个词语的类别来判断情感,比如“

2017-05-27 16:35:46 867

原创 中文抽象语义表示

中文抽象语义表示

2017-05-25 22:24:15 1850

原创 Tensorflow四种交叉熵(cross entropy)算法实现和应用

TensorFlow四种Cross Entropy算法实现和应用深入理解交叉熵算法定义和TensorFlow深度学习框架的函数实现​​​交叉熵介绍交叉熵(Cross Entropy)是Loss函数的一种(也称为损失函数或代价函数),用于描述模型预测值与真实值的差距大小,常见的Loss函数就是均方平方差(Mean Squared Error),定义如下。

2017-05-25 21:55:02 9110

转载 使用TextRank算法为文本生成关键字和摘要

TextRank算法基于PageRank,用于为文本生成关键字和摘要。其论文是: Mihalcea R, Tarau P. TextRank: Bringing order into texts[C]. Association for Computational Linguistics, 2004.先从PageRank讲起。 PageRankPageRank最开始用

2017-05-22 22:13:09 3185

转载 seq2seq Model相关接口介绍

seq2seq Model源码地址调用外部的函数介绍tf.sampled_softmax_loss()tf.sampled_softmax_loss()中调用了_compute_sampled_logits() 关于__compute_sampled_logits()#此函数和nce_loss是差不多的, 取样求lossdef sampled_softmax_

2017-05-17 16:20:37 502

原创

In this paper, we propose an approximate training algorithm based on (biased) importance sampling that allows us to train an NMT model with a much larger target vocabulary. 神经网络翻译模型(Bahdanau et al.,

2017-05-17 12:21:17 159

转载 Sampled Softmax 论文笔记:On Using Very Large Target Vocabulary for Neural Machine Translation

前言记录下Sampled Softmax的一些原理,相当于论文 《 On Using Very Large Target Vocabulary for Neural Machine Translation 》的个人读书笔记,语句很不通顺,仅用作个人记录,若是有人有问题 再讨论吧1 问题NMT(神经网络系统现在已经得到了极大的发展,但是NMT系统一直存在一个问题,就是如何

2017-05-17 11:12:41 701

转载 tensorflow的legacy_seq2seq模块

tensorflow的legacy_seq2seqtensorflow要重新给出一套seq2seq的接口,把之前的seq2seq搬到了legacy_seq2seq下,今天读的就是来自这里的代码。目前很多代码还是使用了老的seq2seq接口,因此仍有熟悉的必要。_extract_argmax_and_embed1234567891011121314151617

2017-05-16 20:58:28 4919 1

转载 tensor flow dynamic_rnn 与rnn有啥区别?

最近看了一下rnn.py中的源码。由于水平有限,没有完全看懂,看到rnn函数和dynamic_rnn函数的时候,总感觉这两函数没啥区别,只是一个输入是 list of tensor,另一个是tensor。而且dynamic并没有想象的那么dynamic,只是将填充的部分输出为0。在每一个train step,传入model的是一个batch的数据(这一个batch的数据forward得到pre

2017-05-16 20:18:47 939

原创 [计划] Leetcode刷题计划

参考该博主系列文章,每天刷题3道!!!

2017-05-16 14:43:11 648

原创 Tensorflow源码解析系列--RNN

Tensorflow RNN源代码解析笔记1:RNNCell的基本实现Tensorflow RNN源代码解析笔记2:RNN的基本实现tensorflow笔记:多层LSTM代码分析(解读PTB,即rnn的内部原理)解读tensorflow之tf.nn.rnn / tf.contrib.nn.static_rnntensor flow dynamic_rnn 与rnn有啥区

2017-05-16 14:40:42 1128

原创 SARSA和Q-learning算法

SARSA和Q-learning算法

2017-05-15 22:25:27 1434

转载 A Painless Q-learning Tutorial (一个 Q-learning 算法的简明教程)

本文是对 http://mnemstudio.org/path-finding-q-learning-tutorial.htm 的翻译,共分两部分,第一部分为中文翻译,第二部分为英文原文。翻译时为方便读者理解,有些地方采用了意译的方式,此外,原文中有几处笔误,在翻译时已进行了更正。这篇教程通俗易懂,是一份很不错的学习理解 Q-learning 算法工作原理的材料。第一

2017-05-15 20:23:57 346

条件随机场(PPT)

2017-04-18

Win下搭建tensorflow的GPU版本

2017-02-15

控制算法的C_C++实现

控制系统 C语言编程 工程实践,本文介绍的是控制算法的工程实践,具有非常重要的实践意义,是非常重要的参考书,不容错过。

2015-07-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除