自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

杨鑫newlife的专栏

算法就是我的灵魂

  • 博客(24)
  • 资源 (192)
  • 收藏
  • 关注

原创 Java Spring Boot项目添加外部jar包,mvn clean package打包不生效

我们添加了jar包,但是打包后发现生成的target项目中没有。解决方案:步骤一:在项目中新建/libs/文件夹,并且把jar包放进去步骤二:project structure加载外部jar包步骤三:修改pom.xml文件,新增:<plugin> <groupId>org.springframework.bo...

2018-11-30 15:11:29 2589

原创 Impala JDBC Driver returns [Simba]ImpalaJDBCDriver Error setting/closing session: {0}

问题: Impala JDBC Driver returns [Simba]ImpalaJDBCDriver Error setting/closing session: {0} 解决思路:出现问题的原因是因为JDBC端口设置错误。Configuring the JDBC PortThe default port used by JDBC 2.0 and later (...

2018-11-29 20:13:35 4082

原创 Java 实现联想输入搜索

/** * SQL 联想搜索返回随机的16个 * @param sql * @return */ @Override public String sqlLenovo(String sql, String db) { List<Map<String, Object>> result = new Arra...

2018-11-29 14:23:53 6123

原创 Java实现Yarn集群资源状态

调用接口发送Http Get请求@Override public ResourceStatusModel getCurrentYarnResource() { String res = httpClientUtil.sendGet(configUtil.readConfig("yarn.web.url")).split("/n")[0]; JSON...

2018-11-27 14:47:14 3126

原创 Java实现web端导出下载数据文件

/** * 在线下载查询后的结果文件 * @param jobID * @param request * @param response */ @Override public void OnLineDownLoadFile(String jobID, HttpServletRequest request, HttpServlet...

2018-11-27 14:43:54 1366

原创 Java实现Druid对SQL的格式化操作

/** * 格式化SQL操作 * @param sql * @return */ public String sqlFormat(String sql){ // 查询的SQL以及对应的SQL类型 String result = SQLUtils.format(sql, JdbcConstants.MYSQL); ...

2018-11-27 14:40:05 5189

原创 java实现Presto在线查询Hive

@Override public String queryHiveData(String sql, int page, int pageSize, String jobID, long startTime) { SQLQueryModel sqlQueryModel = new SQLQueryModel(); if (!sql.equals(sqlUti...

2018-11-27 12:50:38 3035 1

原创 java实现在线停止JDBC中SQL查询

实现思路解析: 维护一个Map<jobID, 连接对象>jobID 这里作为唯一的ID,连接对象每次生成即可存储,结束查询后删除即可。当想停止jobID = 1的JDBC连接,我们只需要在Map中找到jobID = 1,然后取出连接对象,使用conn.close() 即可中断查询服务。代码部分:维护Map部分代码:import com.google...

2018-11-27 12:45:50 4948 2

原创 新建SpringBoot项目打包WAR报错Error assembling WAR: webxml attribute is required

报错信息:Error assembling WAR: webxml attribute is required (or pre-existing WEB-INF/web.xml  springboot启动的项目报错。解决方案: <!-- 没有web.xml文件的情况下构建WAR <plugin> &...

2018-11-21 17:50:11 4798 1

原创 Python实现朴素贝叶斯算法 --- 过滤垃圾邮件

# -*- coding:utf-8 -*-import numpy as npimport randomimport re__author__ = 'yangxin'"""过滤垃圾邮件"""class FilterSpam(object): # 分词操作(匹配任意的非单词字符) def text_parse(self, big_str): ...

2018-11-14 21:06:08 5175 1

原创 Python实现朴素贝叶斯算法 --- 屏蔽社区留言板的侮辱性言论

# -*- coding:utf-8 -*-import numpy as np__author__ = 'yangxin'"""贝叶斯公式p(xy)=p(x|y)p(y)=p(y|x)p(x)p(x|y)=p(y|x)p(x)/p(y)""""""屏蔽社区留言板的侮辱性言论"""class SpeechJudgment(object): def l

2018-11-14 21:04:18 5931 5

原创 朴素贝叶斯中朴素是什么含义?

朴素贝叶斯中的“朴素”二字突出了这个算法的简易性。朴素贝叶斯的简易性表现该算法基于一个很朴素的假设:所有的变量都是相互独立的,假设各特征之间相互独立,各特征属性是条件独立的。 就这一句话就理解了吧。。。...

2018-11-14 20:00:39 14045 1

原创 朴素贝叶斯之条件概率

计算 P(white) 或者 P(black) ,如果事先我们知道石头所在桶的信息是会改变结果的。这就是所谓的条件概率(conditional probablity)。假定计算的是从 B 桶取到白色石头的概率,这个概率可以记作 P(white|bucketB) ,我们称之为“在已知石头出自 B 桶的条件下,取出白色石头的概率”。很容易得到,P(white|bucketA) 值为 2/4 ,P(wh...

2018-11-14 19:55:36 2379

原创 Java实现HTTP Get请求

import org.apache.http.HttpEntity;import org.apache.http.client.methods.CloseableHttpResponse;import org.apache.http.client.methods.HttpGet;import org.apache.http.impl.client.CloseableHttpClient;...

2018-11-14 15:28:02 12837 1

原创 Python实现决策树应用之判断隐形眼镜的类型

代码模块一、DecisionTreePlot# -*- coding:utf-8 -*-__author__ = 'yangxin_ryan'import matplotlib.pyplot as plt"""定义文本框 和 箭头格式 【 sawtooth 波浪方框, round4 矩形方框 , fc表示字体颜色的深浅 0.1~0.9 依次变浅,没错是变浅】"""decisi...

2018-11-10 15:09:19 591

原创 Python实现决策树应用之判断鱼类与非鱼类

代码模块一:DecisionTreePlot  # -*- coding:utf-8 -*-__author__ = 'yangxin_ryan'import matplotlib.pyplot as plt"""定义文本框 和 箭头格式 【 sawtooth 波浪方框, round4 矩形方框 , fc表示字体颜色的深浅 0.1~0.9 依次变浅,没错是变浅】"""deci...

2018-11-10 15:07:11 1493

原创 Python实现DescionTree决策树 --- 选择切分数据集的最佳特征

# 选择切分数据集的最佳特征 def choose_best_feature_to_split(self, data_set): num_features = len(data_set[0]) - 1 # 计算信息熵 base_entropy = self.calc_shannon_ent(data_set) #best_i...

2018-11-07 21:09:48 1999

原创 Python实现DescionTree决策树 --- 划分数据集

""" 划分数据集 [[1, 1, ‘yes’], [1, 1, ‘yes’], [1, 0, ‘no’], [0, 1, ‘no’], [0, 1, ‘no’]] 这个是我们的数据集。 如果我们选取第一个特征值也就是需不需要浮到水面上才能生存来划分我们的数据,这里生物有两种可能,1就是需要,0就是不需要。那么第一个特征的取值就是两种。 如果我们按照第一个特征的...

2018-11-07 20:55:05 1254

原创 Java实现时间工具类

import com.xxx.conf.Constant;import org.springframework.stereotype.Component;import java.text.SimpleDateFormat;import java.util.Calendar;import java.util.Date;/** * @author yangxin_ryan * 时间...

2018-11-05 15:44:21 863

原创 Java实现HiveSQL Parser

import com.xxxx.model.SQLParserResult;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.apache.hadoop.hive.ql.parse.*;import java.util.*;/** * @aut...

2018-11-05 15:42:56 4557 2

原创 Java 实现DruidParser

Ali 开源 Druid 实现SQLParser解析数据库、表、字段、格式化等操作import com.alibaba.druid.sql.SQLUtils;import com.alibaba.druid.sql.ast.SQLStatement;import com.alibaba.druid.sql.dialect.hive.parser.HiveStatementParser;...

2018-11-05 15:40:59 1371

原创 Java检测目录或者文件是否存在,不存在着创建

import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.springframework.stereotype.Component;import java.io.File;import java.io.IOException;/** * @autho...

2018-11-05 15:36:32 9207

原创 Java实现CSV文件读写操作

import com.xxx.conf.Constant;import org.apache.commons.logging.Log;import org.apache.commons.logging.LogFactory;import org.springframework.stereotype.Component;import java.io.BufferedReader;im...

2018-11-05 15:34:58 820

原创 Java中String 、StringBuffer 、StringBuilder区别

1.可变与不可变String类中使用字符数组保存字符串,如下就是,因为有“final”修饰符,所以可以知道string对象是不可变的。private final char value[];StringBuilder与StringBuffer都继承自AbstractStringBuilder类,在AbstractStringBuilder中也是使用字符数组保存字符串,如下就是,可知这两种...

2018-11-02 10:28:54 158

斯坦福文本分类朴素贝叶斯实现课程讲义2021

斯坦福文本分类朴素贝叶斯算法实现课程讲义2021

2022-06-19

An Introduction to HTAP

An Introduction to HTAP

2022-04-26

datax.tar.gz

阿里开源ETL工具DataX

2021-08-22

ImpalaJDBC41.jar

ImpalaJDBC

2021-08-22

hive_jdbc_2.6.2.1002.zip

hive_jdbc_2.6.2.1002

2021-08-22

ClouderaHiveODBC.dmg

ClouderaHiveODBC

2021-08-22

JVM内存管理知识思维导图.png

JVM内存管理知识思维导图.png

2020-05-22

深入浅出Otter与Canal.pdf

深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf深入浅出Otter与Canal.pdf

2020-02-29

weworkapi_python-master.zip

企业微信加密解密函数代码示例weworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zipweworkapi_python-master.zip

2020-01-20

实时指标计算引擎-Spark-Part_1_杨鑫_2019-12-19.pptx

实时指标计算引擎-Spark-Part_1_杨鑫

2019-12-19

Griffin数据质量管理技术调研.pdf

Griffin数据质量管理技术调研.pdf

2019-12-09

Kylin多维分析.pdf

Kylin多维分析.pdf

2019-12-05

CDH5.17版本Hue接入HBase步骤.pdf

CDH5.17版本Hue接入HBase步骤.pdfC

2019-11-28

Apache Kylin竞品分析.pdf

Apache Kylin竞品分析.pdf

2019-11-18

_bz2.cpython-36m-x86_64-linux-gnu.so

_bz2.cpython-36m-x86_64-linux-gnu.so,

2019-11-07

presto-cli-0.223-executable.jar

presto-cli-0.223-executable.jar

2019-11-07

数据仓库规范设计.pdf

数据仓库规范设计.pdf

2019-11-04

基础算法-LP算法_线性规划问题.pptx

基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx,基础算法-LP算法_线性规划问题.pptx

2019-10-17

基础算法-递归-杨鑫20191010.pptx

基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx,基础算法-递归-杨鑫20191010.pptx

2019-10-17

基础算法 - 动态规划-2019-08-01.pptx

基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx,基础算法 - 动态规划-2019-08-01.pptx

2019-10-17

KNN实现水果分类的数据集

KNN实现水果分类的数据集KNN实现水果分类的数据集,KNN实现水果分类的数据集,KNN实现水果分类的数据集

2019-10-17

机器学习算法-神经网络LSTM

机器学习算法-神经网络.pptx

2019-09-21

ML-朴素贝叶斯-2019-07-01.pdf

ML-朴素贝叶斯-2019-07-01.pdf

2019-07-02

udfs-2.0.4-SNAPSHOT.jar

Presto的UDF函数,基本可以覆盖Hive的大多数情况。

2019-06-26

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

Python3实现KNN的三个例子(包含数据集),水果分类,识别手写数字,找相似的朋友

2019-03-06

Presto资源管理Rest API 文档

Presto资源管理Rest API 文档

2018-12-01

ACM学习路线导图

ACM学习路线导图

2018-11-14

Hadoop ResourceManager API

Hadoop ResourceManager API

2018-11-07

Kylin调研报告

Kylin (MOLAP - Multidimensional OnlineAnalytical Processing)调研报告

2018-10-29

ALL in python学习PPT

ALL in python学习PPT

2018-10-28

presto-cli

presto-cli,presto-cli,

2018-10-22

python pep8编码规范

python pep8编码规范

2018-10-17

Confluence-5.6.6-language-pack-zh_CN.jar

Confluence-5.6.6-language-pack-zh_CN.jar,防止confluence乱码的jar包

2018-09-30

AzkabanAPI接口文档汇总

AzkabanAPI接口文档汇总

2018-09-26

MachineLearning-相似度距离公式

MachineLearning-相似度距离公式

2018-09-21

Azkaban元数据库分析

Azkaban元数据库分析,

2018-09-19

Goods: Organizing Google’s Datasets

Goods: Organizing Google’s Datasets,Goods: Organizing Google’s Datasets

2018-09-06

Kudu- Storage for Fast Analytics on Fast Data

Kudu- Storage for Fast Analytics on Fast Data,Kudu- Storage for Fast Analytics on Fast Data

2017-12-21

mongodb-linux-x86_64-3.4.6

mongodb-linux-x86_64-3.4.6,很好用的客户端,请下载使用。

2017-10-17

mongo-hadoop-core-2.0.0

mongo-hadoop-core-2.0.0.jar x x s s sa a a s dd . d d

2017-10-12

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除