自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杨鑫newlife的专栏

算法就是我的灵魂

  • 博客(79)
  • 资源 (192)
  • 收藏
  • 关注

原创 printf()中的%...

printf: 转换说明符 %a 浮点数、十六进制数字和p-计数法(C99) %A 浮点数、十六进制数字和P-计数法(C99) %c 一个字符 %d 有符号十进制整数 %e 浮点数、e-计数法 %E 浮点数、E-计数法 %f 浮点数、十进制计数法 %g 根据数值类型不同自动选择%f或%e。 %e 格式在指数小于-4或者大于等于精度时使用 %G 根

2014-11-30 22:55:25 1343 1

原创 Heritrix安装和配置

实话说我对于这东西是又爱又恨,整了我很久很久。都把电脑整的重装了,才好。对于爬虫来说自己试过nutch,这个也是第一次弄,还好,没有辜负我。 下面讲一下:首先需要注意的是两个东西,一个是需要下载两个包,很多人只下载了一个Heritrix-1.14.zip就以为可以了,然后找不到com文件夹,其实是缺少了一个一个包。需要这两个包才可以,heritrix-1.14.4-

2014-11-30 18:05:41 2148

原创 STL 优先队列学习(二叉堆)

大家找到这篇博客说明你对于数据结构或者c++有所了解,其实这里讲的是数据结构算法中的二叉堆的模板实现,对于二叉堆对来说有大顶堆,小顶堆。这里的C++中的STL库中可以实现,这一功能简化了自己手写模板的麻烦,增加了运用的方便。例如一个程序:就可以实现对于二叉堆挥着队列中的元素进行排序选择最大的元素。 #include #include #include using n

2014-11-29 16:20:57 2580

原创 戴帽子的 --- 字典树

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 8534    Accepted Submission(s): 3072Problem DescriptionA hat’s word is a word in

2014-11-29 08:42:10 949

原创 树学习 ---------字典树(Trie Tree)

字典树,又称为字母数,前缀树等等,不仅可以存储字符,还可以存储数字等,又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来节约存储空间,最大限度地减少无谓的字符串比较,查询效率比哈希表高。   字典树与字典很相似,当你

2014-11-27 00:19:05 1886

原创 const int* 和 int const*的区别?

Thinking in C++ 看到了第八章,讲的是指针。这里提出这两个的区别是:1、const int* 指向const的指针对于这个的解释是:    const int* u;       //u是一个指针, 它指向一个const int.这里不需要初始化,因为u可以是指向任意标识符(也就是说它不是一个const),但是它的值是不能被改变的。2、int const*这个

2014-11-25 23:16:07 2130

原创 怎么打开heritrix.properties

对于这个问题自己很苦恼,自己试了很多办法,首先是把名字改成了heritrix.properties.txt结果打开后发现没有规律,都满满的排在一行,看不出想找的在哪个位置?既然你能搜索到这边文章,那么你肯定是会编程的,那么这就好办了,你可以把这个文件名字改成heritrix.properties.cpp或者heritrix.properties.java用编译器打开,这样打开就

2014-11-25 20:57:41 1793

原创 static class

static class静态类。一般情况下是不可以用static修饰类的。如果一定要用static修饰类的话,通常static修饰的是匿名内部类。在一个类中创建另外一个类,叫做成员内部类。这个成员内部类可以静态的(利用static关键字修饰),也可以是非静态的。由于静态的内部类在定义、使用的时候会有种种的限制。所以在实际工作中用到的并不多。在开发过程中,内部类中使用的最

2014-11-25 20:40:09 1235

原创 java编译时出现Must qualify the allocation with an enclosing instance of type AAA (e.g. x.new A() where x

今天在写一个程序的时候在一个类中写了内部类。在main()中进行了实现,但是在编译的时候进行了报错。自己也不知道错在哪里就出现了这样的英文。Exception in thread "main" java.lang.Error: Unresolved compilation problem: No enclosing instance of type AAA is accessible.

2014-11-25 20:38:26 6107 2

原创 C++ union用法

在看Thinking in C++中看到了union觉得和struct有着很大的联系,这里给大家总结一下。sho

2014-11-24 23:16:47 1766

原创 JAVA中的泛型理解

泛型在Java中经常用到。泛型在本质上是指类型参数化。所谓类型参数化,是指用来声明数据的类型本身,也是可以改变的,它由实际参数来决定。在一般情况下,实际参数决定了形式参数的值。而类型参数化,则是实际参数的类型决定了形式参数的类型。 举个简单的例子。方法max()要求返回两个参数中较大的那个,可以写成:Java代码   这样编写代码当然没有问题。不过,如果

2014-11-24 15:46:14 1072

原创 C++ 中的 sizeof 方法

今天看到一个c++特别方便的方法,类似于 #include 中的strlen

2014-11-24 11:20:15 941

原创 树学习 ---------伸展树(splay Tree)

伸展树(Splay Tree),也叫分裂树,是一种二叉排序树,它能在O(log n)内完成插入、查找和删除操作。它由Daniel Sleator和Robert Tarjan创造,后者对其进行了改进。它的优势在于不需要记录用于平衡树的冗余信息。在伸展树上的一般操作都基于伸展操作。

2014-11-24 10:01:00 1200

原创 树学习 ---------树堆(Treap Tree)

树堆,在数据结构中也称Treap,是指有一个随机附加域满足堆的性质的二叉搜索树,其结构相当于以随机数据插入的二叉搜索树。其基本操作的期望时间复杂度为O(logn)。相对于其他的平衡二叉搜索树,Treap的特点是实现简单,且能基本实现随机平衡的结构。

2014-11-24 09:39:04 1128

原创 如何使用ICTCLAS2014

ICTCLAS是中科院计算所出品的中文分词程序包,在国内一直有着良好的口碑和很高的使用率。之前一直只有 C++的版本提供,而现在C#,Delphi和Java版本已经纷纷出炉。下面用一个极小的例子,让大家10分钟之内就能用上ICTCLAS ,从此也开始自己的文本分类和搜索引擎开发之路。

2014-11-23 10:45:48 1731 2

原创 Lucene中的分词器

1、 StopAnalyzerStopAnalyzer能过滤词汇中的特定字符串和词汇,并且完成大写转小写的功能。2、 StandardAnalyzerStandardAnalyzer根据空格和符号来完成分词,还可以完成数字、字母、E-mail地址、IP地址以及中文字符的分析处理,还可以支持过滤词表,用来代替StopAnalyzer能够实现的过滤功能。3、 Simpl

2014-11-23 10:17:45 1041

原创 1143Tri Tiling --递推

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 2274    Accepted Submission(s): 1302Problem DescriptionIn how many ways can you ti

2014-11-22 15:43:33 741

原创 HDU-ACM1249 三角形-- 递推

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 5039    Accepted Submission(s): 3440Problem Description用N个三角形最多可以把平面分成几个区域? 

2014-11-22 15:16:43 1050

原创 StandardFilter的next方法

//StandardFilter位于org.apache.lucene.analysis.standard包中package analyzer;import org.apache.lucene.analysis.Token;//这里显示的是StandardFilter的next方法public class StandardFilter {public final

2014-11-21 13:03:01 1206

原创 Lucene的标准分析器

//Lucene的标准分析器package analyzer;import java.io.IOException;import java.io.Reader;import java.util.Set;import org.apache.lucene.analysis.TokenStream;import org.apache.lucene.anal

2014-11-20 22:41:49 1221

原创 C#打印出国际象棋的棋盘

用0  1 表示黑和白色

2014-11-19 16:39:01 3188

原创 C++中的vector的使用

vector C++

2014-11-19 15:03:29 712

原创 按文档得分进行排序

//按文档得分进行排序//以下代码首先建立了2本书的Document对象,并且为其建立了索引。在搜索时,使用//Searcher的search(Query, Sort)接口//其中Sort对象取自其自带的一个静态的常量Sort.RELEVANCE,//该常量表示的排序法则按照文档的得分进行降序排列。package sort;import org.apache.luc

2014-11-18 21:34:03 1179

原创 使用Score对文档进行排序

//使用Score对文档进行排序//根据相应的相关度进行排序package sort;import org.apache.lucene.analysis.standard.StandardAnalyzer;import org.apache.lucene.document.Document;import org.apache.lucene.document.Field;

2014-11-18 09:19:44 1202

原创 求Sn=a+aa+aaa+------+aaaaaaa(n个a),

题目:求Sn=a+aa+aaa+------+aaaaaaa(n个a),其中a和n都从键盘中输入,如从键盘中输入2,5,则计算S5=2+22+222+2222+22222。代码:

2014-11-17 09:08:10 2057

原创 求1000以内的回文字符串

题目:如果有一个正整数从左、右来读都是一样的,则称为回文式数(简称回数);比如101,32123,999都是回数。求10000以内的所有回数代码:

2014-11-17 09:06:57 824

原创 彼岸

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 3124    Accepted Submission(s): 1726Problem Description突破蝙蝠的包围,yifenfei来到一处悬崖面前,悬崖

2014-11-16 16:19:48 873

原创 不容易系列之(3)—— LELE的RPG难题

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 31316    Accepted Submission(s): 12515Problem Description人称“AC女之杀手”的超级偶像LELE最近忽然玩起

2014-11-16 16:17:23 626

原创 汉诺塔III

Time Limit: 1000/1000 MS (Java/Others)    Memory Limit: 32768/32768 K (Java/Others)Total Submission(s): 10026    Accepted Submission(s): 4480Problem Description约19世纪末,在欧州的商店中出售一种智力玩具,在一块

2014-11-16 16:16:34 748

原创 骨牌铺方格

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 30308    Accepted Submission(s): 14685Problem Description在2×n的一个长方形方格中,用一个1× 2的骨牌铺

2014-11-16 16:14:21 773

原创 一只小蜜蜂...

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 40983    Accepted Submission(s): 14983Problem Description有一只经过训练的蜜蜂只能爬向右侧相邻的蜂房,不能反

2014-11-16 16:12:26 718

原创 折线分割平面 --- 递推求解

Time Limit: 2000/1000 MS (Java/Others)    Memory Limit: 65536/32768 K (Java/Others)Total Submission(s): 17381    Accepted Submission(s): 11998Problem Description我们看到过很多直线分割平面的题目,今天的这个题目稍

2014-11-16 16:04:00 904

原创 欧几里得算法 --- 辗转相除法求最大公约数

历史上第一个称得上算法的好像就是这个欧几里得算法,其实就是地球人都知道的辗转相除,不要小看她,她是很美的。

2014-11-16 09:02:55 1006

原创 限定爬虫 --- 输入网址,输出对应的IP地址

//根据主机字符串获得主机IP地址package com;import java.io.BufferedReader;import java.io.IOException;import java.io.InputStreamReader;import java.net.InetAddress;import java.net.UnknownHostException;

2014-11-16 00:32:10 1611

原创 理解主题爬虫源代码

//网络爬虫:理解主题爬虫//指定抓取机票价格的例子package com;import java.io.File;import java.io.FileOutputStream;import java.io.IOException;import java.io.InputStream;import java.io.OutputStream;import o

2014-11-15 23:59:33 3253 2

原创 An Easy Problem --- 贪心

总时间限制: 1000ms 内存限制: 65536kB描述As we known, data stored in the computers is in binary form. The problem we discuss now is about the positive integers and its binary form.Given a positive integ

2014-11-15 20:47:20 990

原创 Nctch简介

Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫Nutch 是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。尽管Web搜索是漫游Internet的基本要求, 但是现有web搜索引擎的数目却在下降. 并且这很有可能进一步演变成为一个公司垄断

2014-11-14 09:02:52 1377

原创 Anagram Search -- CodeForces

time limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputA string t is called an anagram of the string s, if it is poss

2014-11-14 00:22:43 979

原创 Meeting --- Codeforces

time limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputThe Super Duper Secret Meeting of the Super Duper Secret Militar

2014-11-13 23:26:17 723

原创 Arrival of the General

time limit per test2 secondsmemory limit per test256 megabytesinputstandard inputoutputstandard outputA Ministry for Defense sent a general to inspect the Super Secre

2014-11-13 20:20:12 1058

斯坦福文本分类朴素贝叶斯实现课程讲义2021

斯坦福文本分类朴素贝叶斯算法实现课程讲义2021

2022-06-19

An Introduction to HTAP

An Introduction to HTAP

2022-04-26

datax.tar.gz

阿里开源ETL工具DataX

2021-08-22

ImpalaJDBC41.jar

ImpalaJDBC

2021-08-22

hive_jdbc_2.6.2.1002.zip

hive_jdbc_2.6.2.1002

2021-08-22

ClouderaHiveODBC.dmg

ClouderaHiveODBC

2021-08-22

JVM内存管理知识思维导图.png

JVM内存管理知识思维导图.png

2020-05-22

深入浅出Otter与Canal.pdf

深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf

2020-02-29

weworkapi_python-master.zip

企业微信加密解密函数代码示例weworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zip

2020-01-20

实时指标计算引擎-Spark-Part_1_杨鑫_2019-12-19.pptx

实时指标计算引擎-Spark-Part_1_杨鑫

2019-12-19

Griffin数据质量管理技术调研.pdf

Griffin数据质量管理技术调研.pdf

2019-12-09

Kylin多维分析.pdf

Kylin多维分析.pdf

2019-12-05

CDH5.17版本Hue接入HBase步骤.pdf

CDH5.17版本Hue接入HBase步骤.pdfC

2019-11-28

Apache Kylin竞品分析.pdf

Apache Kylin竞品分析.pdf

2019-11-18

_bz2.cpython-36m-x86_64-linux-gnu.so

_bz2.cpython-36m-x86_64-linux-gnu.so,

2019-11-07

presto-cli-0.223-executable.jar

presto-cli-0.223-executable.jar

2019-11-07

数据仓库规范设计.pdf

数据仓库规范设计.pdf

2019-11-04

基础算法-LP算法_线性规划问题.pptx

基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx

2019-10-17

基础算法-递归-杨鑫20191010.pptx

基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx

2019-10-17

基础算法 - 动态规划-2019-08-01.pptx

基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx

2019-10-17

KNN实现水果分类的数据集

KNN实现水果分类的数据集KNN实现水果分类的数据集,KNN实现水果分类的数据集,KNN实现水果分类的数据集

2019-10-17

机器学习算法-神经网络LSTM

机器学习算法-神经网络.pptx

2019-09-21

ML-朴素贝叶斯-2019-07-01.pdf

ML-朴素贝叶斯-2019-07-01.pdf

2019-07-02

udfs-2.0.4-SNAPSHOT.jar

Presto的UDF函数,基本可以覆盖Hive的大多数情况。

2019-06-26

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

2019-03-06

Presto资源管理Rest API 文档

Presto资源管理Rest API 文档

2018-12-01

ACM学习路线导图

ACM学习路线导图

2018-11-14

Hadoop ResourceManager API

Hadoop ResourceManager API

2018-11-07

Kylin调研报告

Kylin (MOLAP - Multidimensional OnlineAnalytical Processing)调研报告

2018-10-29

ALL in python学习PPT

ALL in python学习PPT

2018-10-28

presto-cli

presto-cli,presto-cli,

2018-10-22

python pep8编码规范

python pep8编码规范

2018-10-17

Confluence-5.6.6-language-pack-zh_CN.jar

Confluence-5.6.6-language-pack-zh_CN.jar,防止confluence乱码的jar包

2018-09-30

AzkabanAPI接口文档汇总

AzkabanAPI接口文档汇总

2018-09-26

MachineLearning-相似度距离公式

MachineLearning-相似度距离公式

2018-09-21

Azkaban元数据库分析

Azkaban元数据库分析,

2018-09-19

Goods: Organizing Google’s Datasets

Goods: Organizing Google’s Datasets,Goods: Organizing Google’s Datasets

2018-09-06

Kudu- Storage for Fast Analytics on Fast Data

Kudu- Storage for Fast Analytics on Fast Data,Kudu- Storage for Fast Analytics on Fast Data

2017-12-21

mongodb-linux-x86_64-3.4.6

mongodb-linux-x86_64-3.4.6,很好用的客户端,请下载使用。

2017-10-17

mongo-hadoop-core-2.0.0

mongo-hadoop-core-2.0.0.jar x x s s sa a a s dd . d d

2017-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除