- 博客(16)
- 资源 (2)
- 收藏
- 关注
原创 Leetcode No. 136. Single Number
Given an array of integers, every element appears twice except for one. Find that single one.Note: Your algorithm should have a linear runtime complexity. Could you implement it without using extra me
2016-09-18 23:40:11 408
原创 Kibana安装与初探
日志分析任务1. ElasticSearch1.1 ElasticSearch安装从Elastic官网的Product选择ElasticSearch下载。 这里下载2.3.5版本,仅介绍Window下的安装。将下载好的zip包解压直接放在D盘,直接点击bin下的elasticsearch.bin启动。 打开浏览器输入如下http://localhost:9200,出现如下信息
2016-09-02 23:13:22 10242 1
原创 QuickSort 快排算法 java
快排算法是一种简单而又快速的算法,由冒泡法改进而来,效率高,而且代码量不大,较有代表性,在面试中经常被问到。这里的自己看了几个帖子,手写完成了该算法。 可以通过打印,查看算法完成的过程。引用白话经典算法系列之六 快速排序 快速搞定package basic;import java.util.Arrays;public class QuickSort { public static void ma
2016-03-05 14:23:32 636
原创 Binarysearch 二分查找
看似简单的二分查找,但是实际写起来的时候就不是那么回事了。也在校招的机器学习岗位面试上被问到了,没有无误的写出,被直接赶走。看编程珠玑,也是说,在Bell实验室,规定时间内,很多工程师写不全对。也曾看到有人感叹,做了6年的程序员,面试时被一道冒泡排序卡住。感觉算法和数据结构作为一个工程师的基本技能是必须要加强的。下面直接列代码,需注意的是,在计算middle的值的时候,我们需要更换上下界。但是如果直
2016-03-04 23:03:26 538
原创 leetcode 83. Remove Duplicates from Sorted List
Given a sorted linked list, delete all duplicates such that each element appear only once.For example, Given 1->1->2, return 1->2. Given 1->1->2->3->3, return 1->2->3./** * Definition for singly-lin
2016-02-14 00:38:38 356
原创 Leetcode 165. Compare Version Numbers
Compare two version numbers version1 and version2. If version1 > version2 return 1, if version1 < version2 return -1, otherwise return 0.You may assume that the version strings are non-empty and conta
2016-02-12 23:39:36 413
原创 运用打分和Boost优化Elasticsearch搜索结果
来自Optimizing Search Results in Elasticsearch with Scoring and Boosting 作者:Neil Alex 2015/03/18虽然es提供了高效的打分函数,但是在电商环境下还是不够用。大多数的用户还是关注排在前几名的结果,所以有灵活的打分机制尤为重要。如果能根据用户的需要展示搜索结果,那么转化率就尤其可观了。本文中,我们先来看看es默认的
2016-01-25 17:18:15 25505
原创 Leetcode 326. Power of Three
Given an integer, write a function to determine if it is a power of three. Follow up: Could you do it without using any loop / recursion? Credits: Special thanks to @dietpepsi for adding this probl
2016-01-21 17:26:40 486
原创 相关度排序课程:第二部分
域加权如果在“有用”的field找到query中的词这种文本排序方式十分有效。最常见的例子就是如果在标题中找到query里面的词给的分数应该比在body中找到得分高。有一些搜索引擎(比如:微软的FAST引擎)十分依赖那些在索引中对一些field的权重有特殊结构的field加权,这种权重叫做“混合域”。其他一些引擎实现了词拓展和boost的field加权。比如,用户给了一个query“georage
2016-01-20 13:00:16 460
原创 Relevancy 3.1 搜索相关性探究
作者Paul Nelson,Search Technologies首席架构师 转载自searchtechnologies,如有侵权请联系shinehiy@foxmail.com本文是该系列文章的第一篇。我本想把本文命名为“Relevancy101”但是对于已经成为学术研究主要领域的搜索来说太过狭隘。那我们就来开启这个研究生课程吧,打开你的书包,把奇多和汽水都掏出来,我们消停一会,就来说说搜索引擎相
2016-01-18 22:35:19 573
原创 elasticsearch评分进阶
elasticsearch 评分进阶原文引用自:Advanced Scoring in elasticsearch,作者还有一篇Elasticsearch评分的经验说明,建议爬墙参考slideshare上的资源对照查看。 如有侵权请联系:shinehiy@foxmail.com之前关于elasticsearch的文章中,提到并解释了Lucene的内建评分算法的机制。也简要的提到了通过给不同的文档的
2016-01-14 21:47:59 8469 3
原创 com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure
我的需求是数据库中有一个表,其字段为,id,词,主题,主题,该词在该主题下出现的概率(LDA生成的内容)。我要为利用数据库中的内容为每一条微博计算其在主题上的概率,于是我需要不停的做select,进行全表扫描。 我以id和topic作为联合主键,将type建立了索引。原本是一个txt文件,读入数据库后数据量达到了3600w,所以我有200个主题,就以每五个一个主题一个分表建立了分表,这样查询更
2015-05-02 15:31:57 3394
原创 R语言微博数据处理(2)
昨天完成了对@User的匹配,今天阅读了《30分钟学习正则表达式》,终于把#Hashtags#的匹配完成了。#拿到所有的hashtagx m regmatches(x, m)查了很多相关的#的正则匹配,结果还是简单的才是好用的,满足自己需求的还是好使的。
2015-02-14 20:54:52 643
原创 R语言的微博数据处理
用R语言处理微博数据,用到TM包,rJava包,slam包,自己还对李舰老师的Rwordseg进行了反编译,将最新的ansj弄了进去。首先来进行下微博的处理,我将每一个用户的微博放在一个文档中,文档名为用户id+.txt。首先导入需要用的包:##################导入相关包,设置workspace#######################library(tm)
2015-02-14 00:22:50 3399 1
Hibernate实战
2016-10-25
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人