自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (3)
  • 收藏
  • 关注

原创 腾讯社交广告大赛总结

没想到这么快就又跳槽了,新工作业务压力小,个人时间比较多,所以第一次认真地参加完了一个比赛,收获良多。这个比赛旨在预测广告的转化率pCVR,加入转化率因子优化排序(有的广告可能ctr高,但是转化低),提升广告投放效果,提升ROI。        技术上面的一些收获和展望:1. 数据集的划分: 数据集的划分要与最终提交的测试集预测逻辑一致。提交的预测集是根据31号之前的数据预测31号的转化率

2017-06-10 13:58:32 2981 1

转载 nlp研究领域与方法的知识体系

看到一篇“语义分析的一些方法”的文章,对构建nlp知识体系比较有用,来源为:http://www.flickering.cn/ads/2015/02/%E8%AF%AD%E4%B9%89%E5%88%86%E6%9E%90%E7%9A%84%E4%B8%80%E4%BA%9B%E6%96%B9%E6%B3%95%E4%B8%80/http://www.flickering.cn/ads/2

2017-04-04 11:16:39 6369

原创 Tensorflow中Demo学习:RNN语言模型

花了一天时间读Tensorflow中递归神经网络demo(http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/recurrent.html)。使用PTB数据集,构造RNN语言模型,利用当前词预测下一个词。一些有用的参考文章记录如下:http://blog.csdn.net/a343902152/article/detail

2017-04-02 12:10:01 2689

原创 TensorFlow安装过程尝试-Ubuntu 14.04 + GTX 1060

最近对TensorFlow比较感兴趣,将整个安装的程记录如下。Step 1: Ubuntu系统的安装。我采用的是双系统,安装的Ubuntu版本是14.04。系统的安装这里不作介绍,需要注意的是必须安装64位的系统。Step 2: jdk8的安装。(2.1)下载jdk文件下载对应版本的jdk文件,网址为www.oracle.com/technetwork/cn/java/java

2016-11-28 16:13:30 3417 1

转载 GBDT算法整理

最近重点学习了gbdt算法,看了较多的博客文章,整理了一下这些比较有用的内容,包括算法理论、算法分析、代码剖析、注意事项等各个方面。转载来源:http://www.cnblogs.com/rocketfan/p/4324605.htmlhttp://www.cnblogs.com/rocketfan/p/4365950.htmlhttp://www.cnblogs.com/

2016-03-15 16:15:33 33308 3

转载 损失函数(Loss Function)

看到一篇讲解损失函数的博客,写的比较好,转载来源http://www.cnblogs.com/rocketfan/p/4083821.htmlhttp://www.ics.uci.edu/~dramanan/teaching/ics273a_winter08/lectures/lecture14.pdf1. Loss Function损失函数可以看做 误差部分(loss

2016-03-15 14:04:35 16527

转载 [转]GBDT(Gradient Boosting Decision Tree)迭代决策树

转载来源: http://blog.csdn.net/lszdh/article/details/33305257一、前言阿里的比赛一直是跟着大神们的脚步,现在大家讨论最多的是gbrt(Gradient Boost Regression Tree),也就是GBDT(Gradient Boosting Decision Tree)迭代决策树。所以先看了决策树,见上一篇博客决策树。

2016-03-07 22:24:06 1039

转载 到底什么是上下文无关文法(CFG)?

在龙书Compilers - Principles, Techniques, & Tools英文版第2版42页中,提到上下文无关文法有以下的特点: 一个终结符的有限集(A set of terminal symbols),构成文法的最基本的字符就是这个文法的终结符,例如一个能够产生个位数的文法规则digit --> 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9

2016-01-11 11:08:53 6886 1

转载 各种分类算法的比较

面试的时候,经常会被问到一些分类算法的优劣比较。看到一些有用的相关文章,总结下来仅供参考:Source 1. http://sigvc.org/bbs/thread-3323-1-1.htmlHow do you know what machine learning algorithm to choose for your classification problem? Of co

2015-12-30 14:07:05 3162

原创 并行编程实战记录----多线程与MPI多进程

工作半年以来,大部分时间都在做RNN的研究,尤其是通过lstm(long-short term memory)构建识别模型。我专注的是使用rnnlib工具开展模型的训练工作,以搭建有效的识别模型。Rnnlib(http://sourceforge.net/projects/rnnl/)由Alex Graves提供,是解决序列识别问题的RNN工具包,尤其是对隐含层提供了lstm的算法实现。在Alex

2015-12-21 18:06:30 18892 2

转载 多进程与多线程

转自http://zh.wikipedia.org/wiki/行程間通訊进程(英语:Process,中国大陆译作进程,台湾译作行程) 是具有一定独立功能的程序关于某个数据集合上的一次运行活动,是系统进行资源分配和调度的一个独立单位。程序是一组指令的有序集合,它本身没有任何运行的含义,只是一个静态实体。进程是程序在某个数据集上的执行,是一个动态实体(程序是一组指令的有序集合,它本身没

2015-12-07 10:48:11 853

转载 free 和 delete 把指针怎么了

转自http://www.cnblogs.com/kaituorensheng/archive/2013/08/09/3247687.html     使用free或delete之后,只是把指针所指的内容给释放掉,但是指针并没有被干掉,还是指向原来位置(并不是执行NULL),此时指针指向的内容为垃圾,被称为“野指针”。     举例说明几个重要容易迷糊的特征:1. 指针

2015-11-26 11:17:14 902

转载 LIB和DLL的区别与使用

调别人代码的时候,碰到一个问题:把a.lib加入依赖之后,编译通过。但调试的时候,却突然弹出来一个错误,告诉我缺少a.dll。于是请教同事并进行了调研之后,感觉学到了很多。转载一篇写的很好的lib、dll区别的博客:共有两种库:一种是LIB包含了函数所在的DLL文件和文件中函数位置的信息(入口),代码由运行时加载在进程空间中的DLL提供,称为动态链接库dynamic link li

2015-09-24 17:56:34 377

转载 windows7环境下theano安装

转载来源:http://blog.sina.com.cn/s/blog_96b836170102vq22.html       要做卷积神经网络的一些东西,所以要装theano,网上很多Theano安装教程版本较老,而各安装包更新很快,参考价值有限。走了很多弯路才装好,把这个过程记录下来,希望对大家有帮助~ ~       我的配置:win7,32位(64和32位安装步

2015-09-06 18:05:42 662

转载 PERL内置特殊变量

这几天在看PERL,想总结一下其中的内置变量,看到一个不错的总结文。一、正则表达式特殊变量:1、$n   :包含上次模式匹配的第n个子串2、$&   :前一次成功模式匹配的字符串3、$`   :前次匹配成功的子串之前的内容4、$’   :前次匹配成功的子串之后的内容5、$+  :前一次使用括号的模式匹配的字符串.二、文件句柄特殊变量:1、$|  :如果设

2015-07-28 15:15:21 581

原创 GMM-HMM学习笔记

最近几天钻研了语音处理中的GMM-HMM模型,阅读了一些技术博客和学术论文,总算是对这个框架模型和其中的算法摸清了皮毛。在这里梳理一下思路,总结一下这几天学习的成果,也是为以后回顾时提高效率。本文主要结合论文和博客资料来介绍我对GMM-HMM的理解,主要分为以下几个部分:第一个部分介绍语音识别总体框架,第二部分介绍典型的HMM结构和识别过程,第三部分介绍HMM的学习算法,最后补充介绍一些其他细

2015-07-17 16:31:23 45923 3

转载 TDNN时延神经网络

近来在了解卷积神经网络(CNN),后来查到CNN是受语音信号处理中时延神经网络(TDNN)影响而发明的。本篇的大部分内容都来自关于TDNN原始文献【1】的理解和整理。该文写与1989年,在识别"B", "D", "G"三个浊音中得到98.5%的准确率,高于HMM的93.7%。是CNN的先驱。普通神经网络识别音素在讲TDNN之前先说说一般的神经网络的是怎样识别音素的吧。假

2015-07-13 11:33:15 3847 1

转载 隐马尔科夫学习资料

学习HMM比较好的一篇文章,共分八个章节。来源http://www.52nlp.cn/hmm-learn-best-practices-one-introduction内容包括:HMM学习最佳范例一:介绍HMM学习最佳范例二:生成模式HMM学习最佳范例三:隐藏模式HMM学习最佳范例四:隐马尔科夫模型HMM学习最佳范例五:前向算法HMM学习最佳范例六:维特

2015-07-13 11:24:13 592

转载 EM及高斯混合模型

本文就高斯混合模型(GMM,Gaussian Mixture Model)参数如何确立这个问题,详细讲解期望最大化(EM,Expectation Maximization)算法的实施过程。单高斯分布模型GSM多维变量X服从高斯分布时,它的概率密度函数PDF为:x是维度为d的列向量,u是模型期望,Σ是模型方差。在实际应用中u通常用样本均值来代替,Σ通常用样本方

2015-07-13 11:20:57 830

转载 leetcode: Divide Two Integers

转载来源: http://www.cnblogs.com/panda_lin/archive/2013/10/30/divide_two_integers.htmlProblem: Divide two integers without using multiplication, division and mod operator.

2014-09-02 17:19:26 395

转载 leetcode之 median of two sorted arrays

这是我做的第二个leetcode题目,一开始以为和第一个一样很简单,但是做的过程中才发现这个题目非常难,给人一种“刚上战场就踩上地雷挂掉了”的感觉。后来搜了一下leetcode的难度分布表(leetcode难度及面试频率)才发现,该问题是难度为5的问题,真是小看了它!网上搜了很多答案,但是鲜见简明正确的解答,唯有一种寻找第k小值的方法非常好,在此整理一下。       首先对leetcod

2014-08-29 14:32:31 434

原创 节点通讯共享信息的问题

(阿里笔试题)现有一完全的P2P共享协议,每次两个节点通讯后都能获取对方已经获取的全部信息,现在使得系统中每个节点都知道所有节点的文件信息,共17个节点,假设只能通过多次两个对等节点之间通讯的方式,则最少需要()次通讯       A、32            B、31            C、30              D、29

2014-08-27 16:34:36 1707

转载 找出数组中长度最长的等差数列

原题目是求一个无序数组中最长的等差数列。求随机数构成的数组中找到长度大于=3 的最长的等差数列, 输出等差数列由小到大:如果没有符合条件的就输出格式:输入[1,3,0,5,-1,6]输出[-1,1,3,5]  解法如下:1.排序2.设极值分别为min, max,那么公差范围为(1..max-min);3.公差d从(1..max-min)循环,求出每次

2014-08-25 17:14:37 2598

转载 字符串的排列组合问题

问题1 :输入一个字符串,打印出该字符串中字符的所有排列。例如输入字符串abc,则输出由字符a、b、c所能排列出来的所有字符串abc、acb、bac、bca、cab和cba。    思路:这是个递归求解的问题。递归算法有四个特性:(1)必须有可达到的终止条件,否则程序将陷入死循环;(2)子问题在规模上比原问题小;(3)子问题可通过再次递归调用求解;(4)子问题的解应能组合成整个问题的解。 

2014-08-19 11:01:34 442

原创 整数数组的最大等分组数

问题描述:一个整数数组,长度为n,将其分为m 份,使各份的和相等,求m 的最大值比如{3,2,4,3,6} 可以分成{3,2,4,3,6} m=1;{3,6}{2,4,3} m=2{3,3}{2,4}{6} m=3 所以m 的最大值为3

2014-08-15 20:38:26 2547 1

转载 分类算法总结

目前看到的比较全面的分类算法,总结的还不错. 2.4.1 主要分类方法介绍解决分类问题的方法很多[40-42] ,单一的分类方法主要包括:决策树、贝叶斯、人工神经网络、K-近邻、支持向量机和基于关联规则的分类等;另外还有用于组合单一分类方法的集成学习算法,如Bagging和Boosting等。(1)决策树 决策树是用于分类和预测的主要技术之一,决策树学习是以实例为基础的归纳学习算法

2013-05-13 21:34:25 1020 1

转载 由仓库运输问题(阿里巴巴笔试题)说开来

参加阿里巴巴的笔试,碰到一个仓库运输的问题,题目如下:有N个仓库,每个仓库存储量已知,并且 N 个仓库排成环状(i 和 i + 1 相连,n 和 1 相连)。每次只能把货物在相邻的仓库之间运输,问最少运输多少货物使得所有仓库存储量相同。题目很有意思,通过学习http://www.cnblogs.com/legendmaner/archive/2013/05/06/3062323.htm

2013-05-08 21:39:18 1609

转载 判别模型(discriminative model) 和 生成模型(generative model)

http://blog.sciencenet.cn/home.php?mod=space&uid=248173&do=blog&id=227964http://www.gooseeker.com/cn/node/knowledgebase/discriminative_generative_modelArticle 1【摘要】- 生成模型:无穷样本==》概率密度模型 = 产生模型=

2013-04-24 17:12:45 1352

转载 python操作MySQL数据库

坚持每天学一点,每天积累一点点,作为自己每天的业余收获,这个文章是我在吃饭的期间写的,利用自己零散的时间学了一下python操作MYSQL,所以整理一下。我采用的是MySQLdb操作的MYSQL数据库。先来一个简单的例子吧: import MySQLdbtry:conn=MySQLdb.connect(host='localhost',user='root',passwd=

2013-03-13 16:53:01 633

转载 vi同时编辑多个文件

版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://gentoolinux.blogbus.com/logs/39681413.html如果我们有3个文件要同时编辑:文件是a.c,b.c和c.c,vi命令如何实现呢?vi中如何在这3个文件中进行切换?vi可以在多分割窗口(multi-split-screen)环境下编辑多个文件.要分割屏幕显示多个不

2013-01-22 17:19:51 1166

转载 数据挖掘、机器学习和模式识别关系与区别

数据挖掘和机器学习的区别和联系,周志华有一篇很好的论述《机器学习与数据挖掘》可以帮助大家理解。数据挖掘受到很多学科领域的影响,其中数据库、机器学习、统计学无疑影响最大。简言之,对数据挖掘而言,数据库提供数据管理技术,机器学习和统计学提供数据分析技术。由于统计学往往醉心于理论的优美而忽视实际的效用,因此,统计学界提供的很多技术通常都要在机器学习界进一步研究,变成有效的机器学习算法之后才能再进入数据挖

2013-01-11 14:36:41 654

原创 由“一个关于指针的小问题”想到的:常量指针与指向常量的指针

今天在点击打开链接看到一个关于指针的小问题:#include #includeusing namespace std; int main(){ char *str="AAA"; str[0]='B'; cout << str << endl; return 0;}这段代码的问题在哪儿呢?乍一看我没看出问题,通过学习帖子的回复,还是

2012-11-16 22:45:08 391

原创 C#中定位服务器文件

1. 在文件夹中输入局域网服务器的ip地址,看定位到哪个磁盘。 2.在服务器上对应磁盘创建需要的文件。并设置共享。 3.在C#的XML文件中定位刚创建的服务器文件的url。 4.最后在C#代码中解析XML文件,定位到服务器文件,再使用网络模块便可以进行下载了。

2012-11-15 16:48:40 437

qt4参考手册 学习qt的好帮手

Qt是诺基亚开发的一个跨平台的C++图形用户界面应用程序框架。它提供给应用程序开发者建立艺术级的图形用户界面所需的所用功能。 不错的qt开发手册,可以给大家很大帮助。

2011-05-10

《Qt嵌入式图形开发电子版》

Qt是诺基亚开发的一个跨平台的C++图形用户界面应用程序框架。它提供给应用程序开发者建立艺术级的图形用户界面所需的所用功能。Qt是完全面向对象的,很容易扩展,并且允许真正地组件编程。自从1996年早些时候,Qt进入商业领域,它已经成为全世界范围内数千种成功的应用程序的基础。Qt也是流行的Linux桌面环境KDE 的基础。 基本上,Qt 同 X Window 上的 Motif,Openwin,GTK 等图形界 面库和 Windows 平台上的 MFC,OWL,VCL,ATL 是同类型的东西,但Qt具有优良的跨平台特性、面向对象 、丰富的API、大量的开发文档等优点。

2011-05-10

《24小时Qt编程》电子版

qt入门学习的好帮手,好资料,qt编程指导的经典教程。

2011-05-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除