自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杨鑫newlife的专栏

算法就是我的灵魂

  • 博客(75)
  • 资源 (192)
  • 收藏
  • 关注

原创 HDURevenge of Fibonacci --- 高精度 + 斐波那契数列 + 字典树

Time Limit: 10000/5000 MS (Java/Others)    Memory Limit: 204800/204800 K (Java/Others)Total Submission(s): 2110    Accepted Submission(s): 504Problem DescriptionThe well-known Fibonacci

2014-10-31 00:26:23 1846

原创 RegexQuery正则表达式源代码

package query;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.index.

2014-10-30 23:12:39 1128

原创 WildcardQuery通配符搜索

//通配符匹配//通配符例如:‘*’, ‘?’//在这个方法中首先设定一个带通配符的字符串,再包装秤Term对象,//然后将其作为WilQuery的构造函数的参数传入。package query;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.d

2014-10-30 22:41:47 3222

原创 FuzzyQuery模糊搜索

//模糊搜索,可以进行单字查找package query;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.index.IndexWriter;import org.apache.lucene.index.Term

2014-10-30 18:14:54 2354

原创 MultiPhraseQuery

package query;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.index.

2014-10-30 16:25:31 2023

原创 SQL求圆的面积、周长,已知半径 r=10

.求圆的面积、周长,已知半径 r=10S=πR2L=2πRdeclare @S int, @L int, @r intset @r = 10set @S = Pi() * @r * @rset @L = Pi() * @r * 2print ('圆的面积是:' + cast(@S as nchar(10)))print ('圆的周长是: ' + cast(@

2014-10-30 11:59:27 5801

原创 SQL求aX2+bX+c=0的根

求aX2+bX+c=0的根,已知 a=1,b=5,c=1declare @a int, @b int, @c int, @X1 int, @X2 intset @a = 1 set @b = 5 set @c = 1if (@b * @b - 4 * @a *@c) >= 0beginset @X1 = (-@b + sqrt(@b * @b - 4 * @a * @c

2014-10-30 11:58:42 1406

原创 SQL有鸡兔同笼

有鸡兔同笼,有头35个,脚94,鸡,兔,各有多少只?declare @x int, @y intset @x = 1set @y = 34while @xbegin if (@x + @y =35 and 2 * @x + 4 * @y = 94)beginprint ('鸡有' + cast(@x as nchar(5)) + '只')print ('鸭有'

2014-10-30 11:58:11 2706

原创 SQL语言写入斐波拉契数列

create table Fib(fibo nchar(4) NULL)declare @x  int, @fibo1 int, @fibo2 int, @fibo3 intset @x = 1set @fibo1 = 1set @fibo2 = 1 while @x beginBEGINset @fibo3 = @fibo2set @fibo2 = @fibo

2014-10-30 11:57:19 1911

原创 RangeQuery的rewrite方法

package query;import org.apache.lucene.index.IndexReader;import org.apache.lucene.index.Term;import org.apache.lucene.index.TermEnum;import org.apache.lucene.search.BooleanClause;import

2014-10-29 23:35:53 991

原创 RangeQuery范围搜索

package query;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.lucene.index.

2014-10-29 23:02:21 1250

原创 C#方法的集成override

using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace ConsoleApplication5{    class Parent    {        public void F()        {       

2014-10-29 16:08:08 951

原创 C#中对于一个小数进行四舍五入

//对一个数进行四舍五入using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace ConsoleApplication5{    class Program    {        static void Main(string[

2014-10-29 15:39:21 1266

原创 C#的类型转换

例子:using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace ConsoleApplication4{    class Program    {        static void Main(string[] args)

2014-10-29 15:35:23 807

原创 C#中 ref参数的操作

C#中 ref参数的操作就是改变它所对应的地址中的内容 using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace ConsoleApplication3{    class Program    {        static

2014-10-29 15:14:06 1037

原创 设定IP地址,利用结构类型输出相应的IP地址

using System;using System.Collections.Generic;using System.Linq;using System.Text;namespace ConsoleApplication1{    struct IPAddress    {        public byte b1, b2, b3, b4;    }

2014-10-29 15:02:42 933

原创 Lucene中BooleanQuery的MUST和MUST_NOT

两个MUST取中间的交集这里选择的是package query;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.ap

2014-10-29 13:41:25 3167

原创 BooleanQuery布尔搜索

顾名思义就是布尔型查询,package query;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache

2014-10-29 13:36:29 1316

原创 HitS内部的缓存实现源代码

//Hits的缓冲机制的源代码package hits;import java.io.IOException;import org.apache.lucene.document.Document;import org.apache.lucene.search.Filter;import org.apache.lucene.search.Query;impor

2014-10-29 00:51:38 988

原创 国家标准代号格式

//=====================国家标准代号==========================//(1)、强制性国家标准:GB XXXXX - XXXX(2)、推荐性国家标准:GB/T XXXXX - XXXX(3)、强制性行业标准编号:XX XXXX - XXXX(4)、推荐性行业标准编号:XX/T XXXX - XXXX(5)、强制性地方标准编号:DBXX

2014-10-28 22:57:31 3036

原创 UML模式

//================UML============//UML的及几种设计模式桥接模式:将对象部分和它的实现部分分离,使它们可以独立地变化。策略模式:定义一系列的算法,将每个算法封装到具有共同接口的独立类中,从而使得算法可以相互替换,而不影响客户端。抽象工厂模式:提供一个创建一系列相关或相互依赖对象的接口,而无需指定它们具体的类

2014-10-28 22:56:06 877

原创 C指针编程之道 ---第一次笔记

指针学习

2014-10-28 22:46:12 1889

原创 写一个方法void sanjiao(int a,int b,int c),...........................

题目:写一个方法void sanjiao(int a,int b,int c),判断三个参数是否能构成一个三角形,如果不能则抛出异常IllegalArgumentException,显示异常信息“a,b,c不能构成三角形”,如果可以构成则显示三角形三个边长,在主方法中得到命令行输入的三个整数,调用此方法,并捕获异常。代码:package helloWorld;

2014-10-27 23:59:10 3814

原创 Hits详解

//====Hits详解====////这是Hits的几个公有的接口//取得当前结果集的数量//public final int length()//取得当前结果集中第N个Document//public fianal Document doc(int n) throws IOException//取得当前结果集中第N个Document的得分//

2014-10-27 23:49:53 1477

原创 IndexSearcher的基础

//IndexSearcher的三个共有的构造函数,均将索引的存放目录作为参数/* * public IndexSearcher(String path) throws IOException * public IndexSearcher(Directory directory) throws IOException * public IndexSearcher(IndexRead

2014-10-27 22:47:01 1279

原创 Java学习笔记 --- 异常处理 throws 和 throw区别与联系

Java学习笔记 --- 异常处理 throws 和 throw区别与联系

2014-10-27 15:09:12 907

原创 HDU 1251 统计难题(trie树入门)

Problem DescriptionIgnatius最近遇到一个难题,老师交给他很多单词(只有小写字母组成,不会有重复的单词出现),现在老师要他统计出以某个字符串为前缀的单词数量(单词本身也是自己的前缀). Input输入数据的第一部分是一张单词表,每行一个单词,单词的长度不超过10,它们代表的是老师交给Ignatius统计的单词,一个空行代表单词表的结束

2014-10-27 11:54:07 836

原创 猴子吃桃子问题 -- 递推算法(倒推)

问题;猴子吃桃子问题。猴子第一天摘下若干个桃,当即只一半,又多吃一个。第二天早上又将剩下的一半吃掉一半,双多吃一个。以后每天早上都吃了前天剩下的一半零一个,到第10天早上只剩下最后一个桃。问第一天摘了几个桃。解题分析

2014-10-27 09:40:32 5538

原创 插入排序 --- 算法

插入排序:插入即表示将一个新的数据插入到一个有序数组中,并继续保持有序。例如有一个长度为N的无序数组,进行N-1次的插入即能完成排序;第一次,数组第1个数认为是有序的数组,将数组第二个元素插入仅有1个有序的数组中;第二次,数组前两个元素组成有序的数组,将数组第三个元素插入由两个元素构成的有序数组中......第N-1次,数组前N-1个元素组成有序的数组,将数组的第N个元素插入由N-1个元素构成的有

2014-10-26 23:40:56 868

原创 Lucene中的锁commit.lock 和 writer.lock

commit.lock 和 writer.lock//在Lucene设计的同时,设计了Lucene的'锁',//1、writer.lockwriter.lock出现在向缩影中添加文档时,或者将文档从索引中删除时。writer.lock会在Index.writer被初始化时创建,然后会在调用IndexWriter的close()方法是被释放。2、commit.lock

2014-10-26 21:26:31 2482

原创 使用ID号来删除特定文档

//前面已经说了,在建立索引的过程中,Lucene会为每一个加入索引的Document赋予一个ID号。//这个ID号标识每个文档。//这里的删除机制类似于一个操作系统里的回收站的机制。既可以删除,又可以恢复。package directory; import org.apache.lucene.analysis.standard.StandardAnalyzer;imp

2014-10-26 20:45:15 1009

原创 索引的读取工具IndexReader

//索引的读取工具IndexReader//在Lucene中的index包中有一个重要的工具IndexReader。//它主要负责对索引的各种读取和维护工作。//IndexReader本身是一个抽象类。它有一个子类MultiReader,//通常,无须关注其子类的实现,因为IndexReader本身提供了一个静态方法//来获取一个它的子类的实现package index;

2014-10-26 16:42:42 1097

原创 使用IndexWriter来合并

//合并两个索引目录package directory;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;import org.apache.l

2014-10-25 08:17:59 1009

原创 FSDirectory 与 RAMDirectory

//public IndexWriter(Directory d, Analyzer a, boolean create)//中的Directory类型,在Lucene工具当中有两个子类分别是RAMDirectory 和 FSDirectory//这两个目录度可以作为索引的存储路径//RAMDirectory是存放到内存当中的一个区域,FSDirectory是存放到文件系统中的磁盘里

2014-10-24 17:26:19 3067

原创 Lucene中的合并因子mergeFactor

mergeFactor是用来决定segment该如何被addDocument()方法进行合并的。当mergeFactor取比较小的值时,索引时所使用的内存较少而且搜素未优化的速度会比较快。因此,mergeFactor取值较大时(比如大于10),适合于批量的索引建立,而当搜索未优化索引的速度会更快,但是索引建立的速度会比较慢。当mergeFactor取较大的值时,建立索引的速度会

2014-10-23 20:24:02 1758

原创 Lucene 中 .fdx 和 .fdt 和.tis和.tii 还有.cfs含义

1、.fdx 和 .fdt是使用综合的两个文件,其中.fdt用于存储具有Store.YES属性的Field的数据而.fdt则是一个索引,用于存储Document在.fdt中的位置。2、.tis文件用于存储分词后的词条(Term), 而.tii就是它的索引文件,它标明了每个.tis文件中的词条位置。3、.cfs(复合索引格式):在IndexWriter总有一个属性:use

2014-10-23 16:24:19 2862

原创 Lucene 中.fnm格式

.fnm格式的文件中包含了Document中所有的field名称,比如,有如下的代码chuangjian

2014-10-23 14:54:05 1355

原创 索引的segment

每个segment代表Lucene的一个完整的索引段

2014-10-23 13:58:34 1173

原创 Lucene中对PostingTable进行排序,Posting源码

在DocumentWriter的addadocumenpackage indexwriter;//Posting类源码import org.apache.lucene.index.Term;import org.apache.lucene.index.TermVectorOffsetInfo;public class Posting {//词条对象Ter

2014-10-23 13:20:16 1141

原创 线段树基础入门学习(适合在notnoly success以前看)

线段树是一种二叉搜索树,与区间树相似,它将一个区间划分成一些单元区间,每个单元区间对应线段树中的一个叶结点。      对于线段树中的每一个非叶子节点[a,b],它的左儿子表示的区间为[a,(a+b)/2],右儿子表示的区间为[(a+b)/2+1,b]。因此线段树是平衡二叉树,最后的子节点数目为N,即整个线段区间的长度。      使用线段树可以快速的查找某一个节点在若干条线段中出现的次数

2014-10-22 16:34:07 784

斯坦福文本分类朴素贝叶斯实现课程讲义2021

斯坦福文本分类朴素贝叶斯算法实现课程讲义2021

2022-06-19

An Introduction to HTAP

An Introduction to HTAP

2022-04-26

datax.tar.gz

阿里开源ETL工具DataX

2021-08-22

ImpalaJDBC41.jar

ImpalaJDBC

2021-08-22

hive_jdbc_2.6.2.1002.zip

hive_jdbc_2.6.2.1002

2021-08-22

ClouderaHiveODBC.dmg

ClouderaHiveODBC

2021-08-22

JVM内存管理知识思维导图.png

JVM内存管理知识思维导图.png

2020-05-22

深入浅出Otter与Canal.pdf

深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf

2020-02-29

weworkapi_python-master.zip

企业微信加密解密函数代码示例weworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zip

2020-01-20

实时指标计算引擎-Spark-Part_1_杨鑫_2019-12-19.pptx

实时指标计算引擎-Spark-Part_1_杨鑫

2019-12-19

Griffin数据质量管理技术调研.pdf

Griffin数据质量管理技术调研.pdf

2019-12-09

Kylin多维分析.pdf

Kylin多维分析.pdf

2019-12-05

CDH5.17版本Hue接入HBase步骤.pdf

CDH5.17版本Hue接入HBase步骤.pdfC

2019-11-28

Apache Kylin竞品分析.pdf

Apache Kylin竞品分析.pdf

2019-11-18

_bz2.cpython-36m-x86_64-linux-gnu.so

_bz2.cpython-36m-x86_64-linux-gnu.so,

2019-11-07

presto-cli-0.223-executable.jar

presto-cli-0.223-executable.jar

2019-11-07

数据仓库规范设计.pdf

数据仓库规范设计.pdf

2019-11-04

基础算法-LP算法_线性规划问题.pptx

基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx

2019-10-17

基础算法-递归-杨鑫20191010.pptx

基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx

2019-10-17

基础算法 - 动态规划-2019-08-01.pptx

基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx

2019-10-17

KNN实现水果分类的数据集

KNN实现水果分类的数据集KNN实现水果分类的数据集,KNN实现水果分类的数据集,KNN实现水果分类的数据集

2019-10-17

机器学习算法-神经网络LSTM

机器学习算法-神经网络.pptx

2019-09-21

ML-朴素贝叶斯-2019-07-01.pdf

ML-朴素贝叶斯-2019-07-01.pdf

2019-07-02

udfs-2.0.4-SNAPSHOT.jar

Presto的UDF函数,基本可以覆盖Hive的大多数情况。

2019-06-26

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

2019-03-06

Presto资源管理Rest API 文档

Presto资源管理Rest API 文档

2018-12-01

ACM学习路线导图

ACM学习路线导图

2018-11-14

Hadoop ResourceManager API

Hadoop ResourceManager API

2018-11-07

Kylin调研报告

Kylin (MOLAP - Multidimensional OnlineAnalytical Processing)调研报告

2018-10-29

ALL in python学习PPT

ALL in python学习PPT

2018-10-28

presto-cli

presto-cli,presto-cli,

2018-10-22

python pep8编码规范

python pep8编码规范

2018-10-17

Confluence-5.6.6-language-pack-zh_CN.jar

Confluence-5.6.6-language-pack-zh_CN.jar,防止confluence乱码的jar包

2018-09-30

AzkabanAPI接口文档汇总

AzkabanAPI接口文档汇总

2018-09-26

MachineLearning-相似度距离公式

MachineLearning-相似度距离公式

2018-09-21

Azkaban元数据库分析

Azkaban元数据库分析,

2018-09-19

Goods: Organizing Google’s Datasets

Goods: Organizing Google’s Datasets,Goods: Organizing Google’s Datasets

2018-09-06

Kudu- Storage for Fast Analytics on Fast Data

Kudu- Storage for Fast Analytics on Fast Data,Kudu- Storage for Fast Analytics on Fast Data

2017-12-21

mongodb-linux-x86_64-3.4.6

mongodb-linux-x86_64-3.4.6,很好用的客户端,请下载使用。

2017-10-17

mongo-hadoop-core-2.0.0

mongo-hadoop-core-2.0.0.jar x x s s sa a a s dd . d d

2017-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除