NvLand-CSDN博客

原创 Java源码阅读-总体结构

Java源码阅读-总体结构参考：利用Idea生成的类图分析框架源码 java集合概览图

2018-08-06 22:59:57 328

原创 Leetcode No. 136. Single Number

Given an array of integers, every element appears twice except for one. Find that single one.Note: Your algorithm should have a linear runtime complexity. Could you implement it without using extra me

2016-09-18 23:40:11 408

原创 Kibana安装与初探

日志分析任务1. ElasticSearch1.1 ElasticSearch安装从Elastic官网的Product选择ElasticSearch下载。这里下载2.3.5版本，仅介绍Window下的安装。将下载好的zip包解压直接放在D盘，直接点击bin下的elasticsearch.bin启动。打开浏览器输入如下http://localhost:9200，出现如下信息

2016-09-02 23:13:22 10242 1

原创 QuickSort 快排算法 java

快排算法是一种简单而又快速的算法，由冒泡法改进而来，效率高，而且代码量不大，较有代表性，在面试中经常被问到。这里的自己看了几个帖子，手写完成了该算法。可以通过打印，查看算法完成的过程。引用白话经典算法系列之六快速排序快速搞定package basic;import java.util.Arrays;public class QuickSort { public static void ma

2016-03-05 14:23:32 636

原创 Binarysearch 二分查找

看似简单的二分查找，但是实际写起来的时候就不是那么回事了。也在校招的机器学习岗位面试上被问到了，没有无误的写出，被直接赶走。看编程珠玑，也是说，在Bell实验室，规定时间内，很多工程师写不全对。也曾看到有人感叹，做了6年的程序员，面试时被一道冒泡排序卡住。感觉算法和数据结构作为一个工程师的基本技能是必须要加强的。下面直接列代码，需注意的是，在计算middle的值的时候，我们需要更换上下界。但是如果直

2016-03-04 23:03:26 538

原创 leetcode 83. Remove Duplicates from Sorted List

Given a sorted linked list, delete all duplicates such that each element appear only once.For example, Given 1->1->2, return 1->2. Given 1->1->2->3->3, return 1->2->3./** * Definition for singly-lin

2016-02-14 00:38:38 356

原创 Leetcode 165. Compare Version Numbers

Compare two version numbers version1 and version2. If version1 > version2 return 1, if version1 < version2 return -1, otherwise return 0.You may assume that the version strings are non-empty and conta

2016-02-12 23:39:36 413

原创运用打分和Boost优化Elasticsearch搜索结果

来自Optimizing Search Results in Elasticsearch with Scoring and Boosting 作者：Neil Alex 2015/03/18虽然es提供了高效的打分函数，但是在电商环境下还是不够用。大多数的用户还是关注排在前几名的结果，所以有灵活的打分机制尤为重要。如果能根据用户的需要展示搜索结果，那么转化率就尤其可观了。本文中，我们先来看看es默认的

2016-01-25 17:18:15 25505

原创 Leetcode 326. Power of Three

Given an integer, write a function to determine if it is a power of three. Follow up: Could you do it without using any loop / recursion? Credits: Special thanks to @dietpepsi for adding this probl

2016-01-21 17:26:40 486

原创相关度排序课程：第二部分

域加权如果在“有用”的field找到query中的词这种文本排序方式十分有效。最常见的例子就是如果在标题中找到query里面的词给的分数应该比在body中找到得分高。有一些搜索引擎(比如：微软的FAST引擎)十分依赖那些在索引中对一些field的权重有特殊结构的field加权，这种权重叫做“混合域”。其他一些引擎实现了词拓展和boost的field加权。比如，用户给了一个query“georage

2016-01-20 13:00:16 460

原创 Relevancy 3.1 搜索相关性探究

作者Paul Nelson，Search Technologies首席架构师转载自searchtechnologies，如有侵权请联系shinehiy@foxmail.com本文是该系列文章的第一篇。我本想把本文命名为“Relevancy101”但是对于已经成为学术研究主要领域的搜索来说太过狭隘。那我们就来开启这个研究生课程吧，打开你的书包，把奇多和汽水都掏出来，我们消停一会，就来说说搜索引擎相

2016-01-18 22:35:19 573

原创 elasticsearch评分进阶

elasticsearch 评分进阶原文引用自：Advanced Scoring in elasticsearch，作者还有一篇Elasticsearch评分的经验说明，建议爬墙参考slideshare上的资源对照查看。如有侵权请联系：shinehiy@foxmail.com之前关于elasticsearch的文章中，提到并解释了Lucene的内建评分算法的机制。也简要的提到了通过给不同的文档的

2016-01-14 21:47:59 8469 3

原创 com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure

我的需求是数据库中有一个表，其字段为，id，词，主题，主题，该词在该主题下出现的概率（LDA生成的内容）。我要为利用数据库中的内容为每一条微博计算其在主题上的概率，于是我需要不停的做select，进行全表扫描。我以id和topic作为联合主键，将type建立了索引。原本是一个txt文件，读入数据库后数据量达到了3600w，所以我有200个主题，就以每五个一个主题一个分表建立了分表，这样查询更

2015-05-02 15:31:57 3394

原创 R语言微博数据处理（2）

昨天完成了对@User的匹配，今天阅读了《30分钟学习正则表达式》，终于把#Hashtags#的匹配完成了。#拿到所有的hashtagx m regmatches(x, m)查了很多相关的#的正则匹配，结果还是简单的才是好用的，满足自己需求的还是好使的。

2015-02-14 20:54:52 643

原创 R语言的微博数据处理

用R语言处理微博数据，用到TM包，rJava包，slam包，自己还对李舰老师的Rwordseg进行了反编译，将最新的ansj弄了进去。首先来进行下微博的处理，我将每一个用户的微博放在一个文档中，文档名为用户id+.txt。首先导入需要用的包：##################导入相关包，设置workspace#######################library(tm)

2015-02-14 00:22:50 3399 1

原创 MYSQL 删除空记录 NULL

数据库小问题，今天在处理数据库中的手

2014-09-16 09:01:31 5251

qq_19598855的专栏