SmallCSer-CSDN博客

转载 git 推送本地分支到远程分支

推送本地分支local_branch到远程分支 remote_branch并建立关联关系 a.远程已有remote_branch分支并且已经关联本地分支local_branch且本地已经切换到local_branch git push b.远程已有remote_branch分支但未关联本地分支local_branch且本地已经切换到local_branch git push -u origin/remote_branch ...

2020-10-21 10:54:38 1177

原创栈、队列、堆在Java/C++/python中的库

1 队列队列是一种特殊的线性表，它只允许在表的前端进行删除操作，而在表的后端进行插入操作。1.1 javaLinkedList类实现了Queue接口，因此我们可以把LinkedList当成Queue来用。Queue<String> queue = new LinkedList<String>();//添加元素到对列queue.offer("a");//出队queue.poll()//获取第一个元素queue.peek();1.2 C++.

2020-09-27 19:54:10 378

转载 Basic Git commands

Here is a list of some basic Git commands to get you going with Git.For more detail, check out theAtlassian Git Tutorialsfor a visual introduction to Git commands and workflows, including exampl...

2019-03-07 11:15:57 258

转载 conda虚拟环境命令

查看所有环境conda info --envs新建虚拟环境conda create -n myenv python=3.6删除虚拟环境conda remove -n myenv --all激活虚拟环境conda activate myenv退出虚拟环境conda deactivate myenv复制虚拟环境conda create -n BBB --clone ...

2019-02-21 17:48:37 634

转载 Djava.ext.dirs

-Djava.ext.dirs会覆盖Java本身的ext设置，java.ext.dirs指定的目录由ExtClassLoader加载器加载，如果您的程序没有指定该系统属性，那么该加载器默认加载$JAVA_HOME/jre/lib/ext目录下的所有jar文件。但如果你手动指定系统属性且忘了把$JAVA_HOME/jre/lib/ext路径给加上，那么ExtClassLoader不会去加载$JAVA

2017-11-30 13:26:58 1175

原创 ubuntu下查看gpu情况

nvidia-smi watch -n 1 nvidia-smi 配合watch命令, 让一秒刷新一次

2017-11-25 21:33:50 11809 2

原创 pip安装指定版本组件

pip install --upgrade keras==2.1.0 升级到指定版本pip install keras==2.1.0 安装指定版本

2017-11-25 15:26:57 8509

原创 multi-labels classification

解决多标签分类问题

2017-11-21 22:02:49 318

原创 keras text classification

Text Classification, Part I - Convolutional NetworksText Classification, Part 2 - sentence level Attentional RNNText Classification, Part 3 - Hierarchical attention network

2017-11-21 21:12:20 1112

原创 Python爬虫博客

http://cuiqingcai.com/category/technique/python静觅崔庆才的个人博客

2017-10-31 21:37:55 591

转载 markDown语法

正文：1、标题的几种写法：第一种：前面带#号，后面带文字，分别表示h1-h6,上图可以看出，只到h6，而且h1下面会有一条横线，注意，#号后面有空格第二种：这种方式好像只能表示一级和二级标题，而且=和-的数量没有限制，只要大于一个就行第三种：这里的标题支持h1-h6，为了减少篇幅，我就偷

2017-10-21 19:01:11 330

原创排序算法

public class Sort { /** * 1 冒泡排序（交换排序）稳定时间复杂度o(n^2),空间复杂度O(1) * * @param a * 待排序数组 */ public void bubbleSort(int a[]) { for (int i = 0; i < a.length; i++) for (int j =

2017-10-18 21:59:41 305

原创折半查找算法

折半查找算法是一种常见的查找算法，适用于带查找序列有序的情况，空间复杂度O(1),时间复杂度O(log(n))。算法实现常见非递归和递归两种，非递归使用循环控制while(startend）public class BinarySearch { /** * 折半查找非递归算法 * * @param a * 带查找数组 * @param k

2017-10-17 21:18:20 759

转载 SVM实现多分类的三种方案

SVM本身是一个二值分类器　　SVM算法最初是为二值分类问题设计的，当处理多类问题时，就需要构造合适的多类分类器。　　目前，构造SVM多类分类器的方法主要有两类　　（1）直接法，直接在目标函数上进行修改，将多个分类面的参数求解合并到一个最优化问题中，通过求解该最优化问题“一次性”实现多类分类。这种方法看似简单，但其计算复杂度比较高，实现起来比较困难，只适合用于小型问题中；

2017-10-16 23:13:52 7352

原创 Longest Substring Without Repeating Characters

Given a string, find the length of the longest substring without repeating characters.Examples:Given "abcabcbb", the answer is "abc", which the length is 3.Given "bbbbb", the answer is "b", with

2017-10-16 21:34:08 191

转载 LeetCode 问题难度，面试出现频率及问题相关数据结构和算法

LeetCode 问题难度，面试出现频率及问题相关数据结构和算法转载自http://blog.csdn.net/kenden23/article/details/14109347统计了LeetCode各个问题的难度，频率，数据结构和算法LeetCode Question Difficulty Distribution

2017-10-15 21:48:24 359

转载局部敏感哈希算法

私认为，文本的相似性可以分为两类：一类是机械相似性；一类是语义相似性。机械相似性代表着，两个文本内容上的相关程度，比如“你好吗”和“你好”的相似性，纯粹代表着内容上字符是否完全共现，应用场景在：文章去重；语义相似性代表着，两个文本语义上的相似程度，比如“苹果”和“公司”的相似性，本篇不做这一讨论，可参考笔者的另外一篇博客： NLP︱句子级、词语级以及句子-词

2017-10-15 21:36:20 15849 2

转载随机森林

在机器学习中，随机森林由许多的决策树组成，因为这些决策树的形成采用了随机的方法，因此也叫做随机决策树。随机森林中的树之间是没有关联的。当测试数据进入随机森林时，其实就是让每一颗决策树进行分类，最后取所有决策树中分类结果最多的那类为最终的结果。因此随机森林是一个包含多个决策树的分类器，并且其输出的类别是由个别树输出的类别的众数而定。随机森林可以既可以处理属性为离散值的量，比如ID3算法，也可以处理属

2017-10-15 20:07:54 523

转载海量数据相似查找系列2 -- Annoy算法

上面一章说了下高维稀疏数据如何通过learning to hash的方法来进行相似查找，这种主要想说下另外一种情况，稠密向量如何进行快速相似查找呢？还是以文本为例吧。之前提到过文本的paragraph2vector的向量表示，以及词word2vector向量表示形式。一旦文档变成这种稠密向量形式，那如何从海量文本中快速查找出相似的Top N 文本呢?所以这里重点想说下Annoy（Approxi

2017-09-28 20:21:38 3663 2

转载海量数据相似查找系列1 -- Minhashing & LSH & Simhash 技术汇总

最近把海量数据如何进行相似查找技术进行个大体汇总，包括高维稀疏数据和稠密数据。这一节重点针对高维稀疏数据情况，说如何通过哈希技术进行快速进行相似查找。试想个案例，就拿推荐系统中item-user矩阵说事。如果你有item数量是百万级别，user是千万级别，这个矩阵是十分稀疏的。你如何计算每一个item的Top N相似item呢？同样海量文本场景，文本集合可以看成doc-word 稀疏

2017-09-28 20:20:39 868

转载 simhash与重复信息识别

simhash与重复信息识别在工作学习中，我往往感叹数学奇迹般的解决一些貌似不可能完成的任务，并且十分希望将这种喜悦分享给大家，就好比说：“老婆，出来看上帝”…… 随着信息爆炸时代的来临，互联网上充斥着着大量的近重复信息，有效地识别它们是一个很有意义的课题。例如，对于搜索引擎的爬虫系统来说，收录重复的网页是毫无意义的，只会造成存储和计算资源的浪费；同时，展示重复的信息对于用户来

2017-09-27 23:17:58 271

原创 linux查看端口号占用情况

netstat -tunlp用于显示tcp，udp的端口和进程等相关情况，如下图netstat -tunlp|grep 端口号，用于查看指定端口号的进程情况，如查看22端口的情况，netstat -tunlp|grep 22，如下图

2017-09-26 10:46:48 378

转载【转】Windows下使用libsvm中的grid.py和easy.py进行参数调优

libsvm中有进行参数调优的工具grid.py和easy.py可以使用，这些工具可以帮助我们选择更好的参数，减少自己参数选优带来的烦扰。所需工具：libsvm、gnuplot本机环境：Windows7(64 bit) ,Python3.51、相关程序的下载和安装：1.1、下载libsvm，我用的是libsvm-3.18.zip，下载后直接解压到任意位置，我解压到C:\libsvm

2017-09-22 17:29:22 532

转载各种优化方法总结比较（sgd/momentum/Nesterov/adagrad/adadelta）

http://blog.csdn.net/luo123n/article/details/48239963前言这里讨论的优化问题指的是，给定目标函数f(x)，我们需要找到一组参数x，使得f(x)的值最小。本文以下内容假设读者已经了解机器学习基本知识，和梯度下降的原理。SGDSGD指stochastic gradient descent，即随机梯度下降。是

2017-07-14 11:16:28 407

原创 Elasticsearch试水

Elasticsearch5 及 head插件安装说明http://www.cnblogs.com/rethink-east/p/6547171.html

2017-06-14 17:38:11 258

转载 Text Generation With LSTM Recurrent Neural Networks in Python with Keras

Recurrent neural networks can also be used as generative models.This means that in addition to being used for predictive models (making predictions) they can learn the sequences of a problem and t

2017-06-04 18:33:14 931

转载 4 text classify method of keras

Github代码： Keras样例解析欢迎光临我的博客：https://gaussic.github.io/2017/03/03/imdb-sentiment-classification/(转载请注明出处：https://gaussic.github.io)Keras的官方Examples里面展示了四种训练IMDB文本情感分类的方法，借助这4个Python程序，可以对Ke

2017-06-04 18:20:37 1080

转载深度学习在推荐领域的应用

作者：吴岸城，菱歌科技首席算法科学家，致力于深度学习在文本、图像、预测推荐领域的应用。曾在中兴通讯、亚信（中国）担任研发经理、高级技术经理等职务。责编：何永灿，欢迎人工智能领域技术投稿、约稿、给文章纠错，请发送邮件至heyc#csdn.net（#改为@）本文为《程序员》原创文章，未经允许不得转载，更多精彩文章请订阅《程序员》当2012年Facebook在广告领域开始应用定

2017-06-04 10:57:53 7068

转载 seq2seq笔记

Learning Phrase Representation using RNN Encode-Decoder for Statistical Machine Translation http://www.zmonster.me/notes/phrase_representation_using_rnn_encoder_decoder.htm TensorFlow中Sequence-to-S

2017-03-08 14:48:49 634

原创 HMM序列标注资料

有监督HMM模型构建自己写中文分词之（三）_用HMM模型实现无词表分词 http://blog.csdn.net/yutianzuijin/article/details/33292841HMM的训练： http://blog.csdn.net/caoeryingzi/article/details/5755854

2017-03-08 10:03:48 838

转载 awk

http://kubicode.me/2015/12/24/Linux/awk-study-list/

2017-02-24 12:07:19 237

转载机器学习常见算法个人总结

http://kubicode.me/2015/08/16/Machine%20Learning/Algorithm-Summary-for-Interview/#KNN算法

2017-02-24 11:28:28 336

转载 BM25算法

BM25 is a bag-of-words retrieval function that ranks a set of documents based on the query terms appearing in each document, regardless of the inter-relationship between the query terms within a docum

2017-02-13 14:36:25 487

转载使用RNN解决NLP中序列标注问题的通用优化思路

2017-01-19 12:03:54 513

原创 rnn

【深度学习与Theano】LSTM网络-情感分析http://blog.csdn.net/UncleMuses/article/details/50558273文本情感分类（二）：深度学习模型http://spaces.ac.cn/archives/3414/

2016-12-23 15:54:55 412

转载 C++ 值传递、指针传递、引用传递详解

原文出处： Geek_Ling 最近写了几篇深层次讨论数组和指针的文章，其中提到了“C语言中，所有非数组的形式参数传递均以值传递形式”数组和指针背后——内存角度语义”陷阱”—数组和指针而关于值传递，指针传递，引用传递这几个方面还会存在误区，所有我觉的有必要在这里也说明一下~下文会通过例子详细说明哦值传递：形参是实参的拷贝，改变形参的

2016-12-22 21:05:28 650

转载 Python pip源配置修改

由于某些不可抗因素，Python官方的包在国内有时无法访问或出现网络不稳定现象。为了解决这个问题就需要将Pip中自带的源地址修改为镜像地址。目前收集的比较好的镜像地址有：http://pypi.v2ex.com/simple/http://pypi.douban.com/simple/http://mirrors.aliyun.com/pypi/simple/直接修改配置的

2016-11-30 18:47:03 5338

原创索引资源

http://blog.csdn.net/napoay

2016-10-28 10:01:43 261

转载 ElasticSearch的基本用法与集群搭建

一、简介ElasticSearch和Solr都是基于Lucene的搜索引擎，不过ElasticSearch天生支持分布式，而Solr是4.0版本后的SolrCloud才是分布式版本，Solr的分布式支持需要ZooKeeper的支持。这里有一个详细的ElasticSearch和Solr的对比：http://solr-vs-elasticsearch.com/二、基本用法Elastic

2016-10-26 15:59:12 528

转载 Levenshtein（编辑）距离

http://wdhdmx.iteye.com/blog/13438560.这个算法实现起来很简单1.百度百科介绍：Levenshtein 距离，又称编辑距离，指的是两个字符串之间，由一个转换成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符，插入一个字符，删除一个字符。编辑距离的算法是首先由俄国科学家Levenshtein提出

2016-08-04 11:22:38 323

hibernate-annotations-3.4.0.GA

hibernate-distribution-3.3.2.GA(源码+文档)

java file类操作实例

java字节流和字符流

空空如也