自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

原创 xgboost

xgboost构建过程xgboost 从顶到底构建树,在从低到顶反向进行剪枝。

2017-06-29 22:03:10 2156 0

原创 C++ 基础知识

static 成员变量在类中用static声明变量,static变量在类外进行定义,并且无法通过构造函数进行定义。class A { public: static int n; A(){} }; int A::n = 1;普通的成员变量是对象的一部分,而static类型...

2017-06-27 21:13:42 194 0

原创 tensorflow总结

tf.variable_scope & tf.name_scopetf.name_scope不会给tf.get_variable()加命名前缀,tf.variable_scope加命名前缀。 查看模型使用的所有变量 for v in tf.all_variables(): prin...

2016-11-11 15:36:33 341 0

原创 Spark Sql

SparkSQL有两个分支,sqlContext和hiveContext , sqlContext支持SQL语法解析器,hiveContext支持SQL语法解析器和hiveSQL语法解析器。

2016-11-11 15:26:31 240 0

原创 ubuntu press S to skip

修改/etc/fstab文件,将提示出问题的分区注释掉,因为启动时系统找不到该分区。

2016-11-08 22:13:05 308 0

原创 linux文件编码格式转换

vim中查看、设置文件编码 :set fileencoding 通过enca命令查看、修改文件编码 //查看文件编码 enca -L zh_CN file //修改文件编码 enca -L zh_CN -x UTF-8 < file > result_file批量修改文件编码

2016-11-08 22:08:26 289 0

原创 scala&spark相关

scalatest 版本要和scala版本一致。 scalac error : bad option: ‘-make:transitive’ 在pom.xml中,删除-make:transitive 一般而言,saveAsTextFile会按照执行task的多少生成多少个文件,比如part-00...

2016-11-07 20:09:59 274 0

原创 nmap、nmblookup

使用nmblookup、nbtscan,客户端要安装sambasudo apt-get install samba查看ip对应的hostnamenmblookup -A 10.2.1.4 | grep '<00' | grep -v GROUP | awk '{...

2016-11-06 23:35:07 1336 0

原创 CUDA(2)

cudaMalloc函数使用限制 1. 可以将cudaMalloc()分配的指针传递给在设备上执行的函数。 2. 可以在设备代码中使用cudaMalloc()分配的指针进行内存读/写操作。 3. 可以将cudaMalloc()分配的指针传递给在主机上执行的函数。 4. 不能在主机代码中使...

2016-09-28 21:03:14 264 0

原创 CUDA(1)

CUDA架构之前的图形处理架构中,计算资源划分为顶点着色器和像素着色器。CUDA架构包含了一个统一的着色器流水线。同时,GPU不仅能任意地读写内存,还能访问软件管理的缓存。CPU与GPUCPU 和 GPU之间浮点运算能力之所以存在这样的差异,原因就在于CPU具有复杂的控制逻辑和大容量的缓存,适合进...

2016-09-27 10:23:41 431 0

原创 thrift

数据传输协议protocolTBinaryProtocol 二进制格式 TCompactProtocol 压缩格式 TJSONProtocol JSON格式 TSimpleJSONProtocol JSON只写协议client和server的数据传输协议必须一致。TransportT...

2016-07-13 15:08:06 341 0

原创 D2RQ

D2RD2R主要包括D2R Server、D2RQ Engine以及D2RQ Mapping语言。D2R Server 是一个HTTP Server,提供对RDF数据的查询访问接口;D2RQ Engine 使用一个可定制的D2RQ Mapping文件(.ttl)将关系型数据库中的数据换成RDF格式...

2016-07-06 15:40:22 1838 0

原创 http session

session与cookiesession一般指的类就是javax.servlet.http.HttpSession。HTTP协议本身是无状态的,cookie机制就是为了解决HTTP协议无状态的缺陷所做的努力,session(服务端)和cookie(客户端)是在客户端和服务器之间保持状态的解决方案...

2016-07-03 22:05:47 668 0

原创 jquery总结

json与对象转换//json字符串转对象 jQuery.parseJSON(jsonstr); //json对象转json字符串 JSON.stringify(jsonobj);

2016-07-03 16:29:19 194 0

原创 linux 总结

//查看内核版本 cat /proc/version uname -a//查看系统版本 lsb_release -a

2016-07-03 09:22:58 355 0

原创 nutch使用

nutch 1.x (nutch 1.11为例)抓取网页存储到本地bin/crawl urls crawl 2建索引bin/nutch solrindex http://127.0.0.1:8983/solr/ crawl/crawldb -linkdb crawl/linkdb crawl...

2016-07-03 09:18:27 677 0

原创 数据库优化

性能瓶颈要正确的优化SQL,需要快速定位性能的瓶颈点。索引索引会大大增加表记录DML(insert、update、delete)的开销。一个表可以建多个索引,一个索引可以由多个字段组成。有些时候,只需要访问表中的几个字段,并且字段内容较少,可以为这几个字段单独建立一个组合索引。 性能优化是无止境...

2016-05-20 21:23:27 240 0

原创 Spring MVC

Controller获取请求参数通过@PathVariable获取路径中的参数@RequestMapping(value="/{id}/{str}") public String test(@PathVariable String id,@PathVariable Str...

2016-03-28 15:00:59 203 0

原创 Docker工具

DockerUI//不支持多主机 //http://<docker host ip>:9000 docker run -d -p 9000:9000 -v /var/run/docker.sock:/var/run/docker.sock dockerui/dockerui

2016-03-23 23:50:02 278 0

原创 Word2Vec数学模型

N-gram模型N-gram模型假设一个词出现的概率只与它前面固定数目的词相关。一般而言,n的选取需要同时考虑计算复杂度和模型效果两个因素。 神经网络语言模型(1) 神经概率语言模型中假定了”相似的”词对应的词向量也是相似的。 (2) 概率函数关于词向量是光滑的,即词向量中的一个小变化对概率的...

2016-03-20 13:13:00 358 0

原创 NLP工具

bosonnlp from bosonnlp import BosonNLP import datetime nlp=BosonNLP('BOSON_API_TOKEN') //中文时间转换 result=nlp.convert_time("去年清明节")...

2016-03-19 22:42:53 662 0

原创 Spring常见问题

1.NoClassDefFoundError: org/springframework/context/event/EventListenerFactory spring的jar包不一致或者确实包。2.java.lang.IncompatibleClassChangeError : clas...

2016-03-07 20:44:54 7520 0

原创 Spring Security权限管理框架

Spring SecuritySpring Security是作为过滤器控制权限的,在web.xml中配置过滤器。<filter> <filter-name>springSecurityFilterChain</filter-name> <...

2016-03-07 20:32:38 2317 0

原创 java网络编程

302重定向重定向的目的url写在header的Location属性。 httpclient以GET发送请求时,http的返回码是200,自动处理了重定向; 以POST发送请求时,http的返回码是302,不自动处理重定向,处于占用连接等待状态。HttpPost request=new Ht...

2016-03-02 20:54:52 232 0

原创 贝叶斯规则和LDA主题模型

共轭先验和共轭分布P(θ\theta) 先验分布、P(θ|X\theta | X)后验分布、P(X |θ\theta)似然函数。 后验分布=先验分布*似然函数/P(X) 使得先验分布和后验分布具有相同的形式,称他们是共轭分布;先验分布称为相应似然函数的共轭先验。 似然函数是关于统计模型中的参...

2016-02-26 15:32:10 1114 0

原创 Cmake使用

基本配置 cmake_minimum_required(VERSION 2.6) project(myproject) set(SRC_LIST main.c) add_executable(myproject ${SRC_LIST}) cmake自带的环境变量PROJEC...

2016-01-25 16:27:26 359 0

原创 Shark机器学习库

安装按照官网上的步骤在linux编译后,安装的默认目录在/usr/local/include和/usr/local/lib目录。 使用shark库时,将CMakeLists.txt放在工程目录下,执行 cmake . make CMakeLists.txt的内容为: cmake_m...

2016-01-24 23:25:46 804 0

原创 C++(2)

智能指针unique_ptrunique_prt不支持复制构造与赋值操作,但可以移动赋值,移动赋值是显式的所有权转移,转移之后前者不再拥有该内存。 #include <memory> unique_ptr<int> one(new int(100)); u...

2016-01-20 22:25:48 316 0

原创 C++(一)

auto vector<int> number(5,10); for(auto& e:number) {   e=e+2;   cout<<(int)e<<endl; } 纯虚函数在基类中只有声明而没有定义,必须在子类...

2016-01-20 14:51:04 318 0

原创 幂律分布与自组织过程

幂律分布服从幂律分布的现象称为无标度现象,即系统中个体的尺度相差悬殊,缺乏一个优选的规模。凡有生命,有进化,有竞争的地方都会出现不同程度的无标度现象。 物理世界在相当程度上是具有惰性的,动态过程总能找到能量消耗最少的途径。

2016-01-19 23:27:26 971 0

原创 正态分布的生成

逆变换法假设U=F(x)是一个概率分布函数,F−1^{-1} 是它的反函数,若U是一个服从(0,1)均匀分布的随机变量,则 F−1(U)^{-1}(U) 服从函数F给出的分布。 Box-Muller算法先得到服从均匀分布的随机数,然后将均匀分布的随机数转变为服从正态分布。 如果(0,1]值域内有...

2016-01-19 16:51:16 1008 0

原创 python/Django使用总结

默认情况下,启动项目 python manage.py runserver 这种情况下,只能本地访问。改变服务器监听的IP地址,可以让其他地址访问项目: python manage.py runserver 0.0.0.0:8000 Django ORM检索数据库 //检索所有对象 ...

2015-12-31 14:08:06 305 0

原创 boost库总结一

progress_display在控制台显示程序的执行进度,但是无法把进度显示输出与程序的输出分离。 #include<boost/progress.hpp> using namespace boost; progress_display pd(long expe...

2015-12-30 16:09:05 319 0

原创 Python/gensim主题模型库

每个py文件称之为模块,每个具有init.py文件的目录被称为包。只要模块或者包所在的目录在sys.path中,就可以使用import 模块或import 包来使用。 如果要使用的模块和当前文件在同一目录,只要import相应的文件名就可以。 如果使用的模块不在同一目录下,使用sys.path....

2015-12-29 23:03:52 7100 0

原创 python/逻辑回归

正则化方法,防止过拟合,提高泛化能力在机器学习算法中,常常将原始数据集分为三部分:training data、validation data 、testing data。 其中validation data用来避免过拟合, 根据validation data上的效果确定学习速率、迭代停止时机等。...

2015-12-25 14:13:10 1007 0

原创 theano学习笔记

定义函数 import theano.tensor as T from theano import function,pp //标量 x=T.dscalar(‘x’) //向量 x=T.vector(“a”) //矩阵 x=T.dmatrix(‘x’)...

2015-12-24 20:57:54 640 0

原创 JVM(三)

执行引擎JVM监控与工具使用JDK中工具大多数是tools.jar包的接口的封装。tools.jar中的类库不属于java的标准API。

2015-12-23 21:22:47 371 0

原创 JVM(二)

class文件结构JVM的语言无关性的基础就是虚拟机和字节码存储格式,只有能把程序代码编译成class文件,虚拟机不关心class的来源是什么语言。 字节码指令提供的语义描述能力比java本身更强大,因此,java无法支持的语言特性并不代表字节码指令不能支持。魔数class文件的前四个字节称为魔...

2015-12-23 15:57:52 263 0

原创 JVM(一)

数据类型java虚拟机可以操作的数据类型有两类:原始类型和引用类型,对应地,有原始值和引用值两种类型的数值。 基本类型包括数值类型、boolean和returnAddress;引用类型包括类类型、接口类型、数组类型。 returnAddress指向一条虚拟机指令的操作码,程序运行期间无法改变r...

2015-12-22 22:40:41 251 0

原创 linux/openssl

在linux中,主要使用openssl和gpg两种方法实现安全机制。单向加密单向加密是计算一段数据的特征码,利用特征码对数据完整性进行校验,且输出定长。常见的加密算法有MD5、SHA1。对称加密对称加密就是加密和解密使用相同的密钥。常见的算法有DES、AES、3DES。非对称加密加密和解密使用的不...

2015-12-21 15:17:05 347 0

提示
确定要删除当前文章?
取消 删除