自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(33)
  • 资源 (1)
  • 收藏
  • 关注

原创 最短摘要问题

有如下最短摘要问题: 在搜索引擎中,会针对每一网站生成一段摘要,并展示在相应query的搜索结果中。给你两个字符串S和T,请设计并实现一个高效的最短摘要生成算法,该算法能找出S中包含所有T中的字符的最短子字符串,即最短摘要,如 输入: S="ADOBECODEBANC" T="ABC" 输...

2019-10-10 15:10:34 326

原创 记一次生产上线的问题

昨天项目上线,在完成验证之后,我深吸一口气,完美上线,未出任何问题。然而半个小时之后,收到运维团队发过来的告警,说是有一台服务器的几个端口未被探测到。当时听说之后,我心中一紧,不对呀,我们服务器之后都观察了系统日志,交易一切正常,如果系统启动异常,日志是不会打印的。于是,我赶紧去操作间登录服务器,检测端口。 netstat -anpl | grep 1099 ...

2019-08-16 11:13:52 1495 1

原创 作为网关如何合理的估算线程池大小

作为一名项目项目经理,在项目上线之后我们经常会遇到一些参数设置的问题,比如今天要讨论的:如何合理的设置线程池大小。 线程池作为应用的关键组成部分,是应用处理业务的关键角色,而线程池大小直接关系着应用的吞吐量、处理能力、响应能力等等各项性能指标,那么线程池的大小设置为多少才是合理的呢? 按照网上各方大神给出了权威指示,线程池大小的设置跟应用的类型有关,一般系统...

2019-07-23 10:40:16 653

原创 基于zookeeper的分布式锁实现

分布式式锁在分布式集群系统中解决资源争用,保证程序和数据一致性的有效手段。比如在电商系统秒杀中,为了保证商品库存不超发,即可通过分布式锁实现对商品库存扣减的控制。 分布式的实现有很多方式,下面列出了三种方式: 1、通过数据库的乐观锁或者唯一索引实现,该实现方式的优点是简单,但缺点也很明显,数据库资源极其昂贵,而且数据库的效率也不容乐观。 ...

2019-06-12 11:55:54 492

原创 完美平方数

给一个正整数 n,写一个函数找到若干个完全平方数(比如 1,4,9,...)使得他们的和等于 n。要求为你需要让平方数的个数最少,输出需要的最少的平方数的个数。格式:输入每一行输入一个 整数 n,输出每一行输出需要最少的平方数的个数。样例输入n = 12n = 13样例输出3  //12 = 4 + 4 + 42 //13 = 4 + 9解题思路,该问题与下楼梯的问题类似,都是斐波那契数列问题令n...

2018-03-15 10:26:12 2541 1

转载 贝叶斯定理

贝叶斯公式为P(A∩B)=P(A)*P(B|A)=P(B)*P(A|B)P(A|B)=P(B|A)*P(A)/P(B)其中:1、P(A)是A的先验概率或边缘概率,称作"先验"是因为它不考虑B因素。2、P(A|B)是已知B发生后A的条件概率,也称作A的后验概率。3、P(B|A)是已知A发生后B的条件概率,也称作B的后验概率,这里称作似然度。4、P(B)是B的先验概率或边缘概率,这里称作标准化常量。5...

2018-03-08 10:58:37 1497

原创 梯度下降

转载自:https://segmentfault.com/a/1190000011994447梯度下降的概念梯度下降法是一个一阶最优化算法,通常也称为最速下降法。要使用梯度下降法找到一个函数的局部极小值,必须向函数上当前点对于梯度(或者是近似梯度)的反方向的规定步长距离点进行迭代搜索。所以梯度下降法可以帮助我们求解某个函数的极小值或者最小值。对于n维问题就最优解,梯度下降法是最常用的方法之一。下面...

2018-03-08 10:02:52 242

转载 逻辑回归

作者:寒小阳 && 龙心尘时间:2015年10月。出处:http://blog.csdn.net/han_xiaoyang/article/details/49123419。声明:版权所有,转载请注明出处,谢谢。1、总述逻辑回归是应用非常广泛的一个分类机器学习算法,它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。2、由来  ...

2018-03-01 17:34:25 193

原创 四元组问题

给定一个包含 n 个数的整数数组 S,写一个函数在 S 中找到所有使得和为给定整数 target 的四元组 ( a,b,c,d )。注意事项:1、四元组 ( a,b,c,d ) 中,需要满足 a <= b <= c <= d2、答案中不可以包含重复的四元组。格式:输入行输入一个有 n 个整数的数组 S 和一个整数 target,最后输出所有满足要求的四元组。样例输入S = [ 1...

2018-02-27 14:44:45 2738

原创 最长公共字符串

给出两个字符串,写一个函数找到最长公共子串,并返回其长度。注意事项:子串的字符应该连续的出现在原字符串中,这与子序列有所不同。格式:输入行输入两个字符串 A 和 B,最后输出最长公共子串的长度。样例输入A = “ABCD”B = “CBCE”样例输出2动态规划算法即可。用“ABDABC”和“ABEABC”做解题思路。直接先上动态规划表。 "ABDABC"0000000A0100100B002002...

2018-02-27 12:13:22 470

原创 字符串编辑距离

给出两个单词word1和word2,写一个函数计算出将word1 转换为word2的最少操作次数。你总共三种操作方法:1、插入一个字符2、删除一个字符3、替换一个字符格式:输入行输入两个字符串 word1 和 word2,最后输出将 word1 转换为 word2的最少操作次数。样例输入word1 = "mart" word2 = "karma"样例输出3动态规划算法即可。 ''karma''01...

2018-02-23 17:23:43 189

原创 数字组合

给出一个候选数字的集合 C 和目标数字 T,写一个函数找到 C 中所有的组合,使找出的数字和为 T。C 中的数字可以无限制重复被选取。注意事项:1、所有的数字(包括目标数字)均为正整数。2、元素组合(a1, a2, … , ak)必须是非降序(ie, a1 ≤  a2  ≤ … ≤  ak)。3、解集不能包含重复的组合。 格式:输入行每一行输入数组 C 和一个目标数字 T,最后输出所有满足条件的组...

2018-02-09 10:56:48 460

原创 组合问题

给出两个整数 n 和 k,写一个函数返回从 1......n 中选出的 k 个数的组合。格式:输入行依次输入一个整数 n 和一个整数 k,最后输出所有 k 个数的组合。样例输入n = 4 k = 2样例输出[ [ 2,4 ],[ 3,4 ],[ 2,3 ],[ 1,2 ],[ 1,3 ],[ 1,4 ]]解题思路。从1,2,3,4,5中取3个数字组合。其组合结果如下:1,2,31,2,41,2,5...

2018-02-08 09:28:09 598

原创 解码方法

有一个消息包含A-Z通过以下规则编码:'A' -> 1'B' -> 2...'Z' -> 26现在给你一个加密过后的消息,问有几种解码的方式,写一个函数实现。格式:输入行第一行输入一个加密后的消息即一个正整数,最后输出可以实现的解码方式的个数。样例输入12

2018-02-05 11:04:22 2521

转载 CSC Matrix

本文转载至http://www.importnew.com/22977.html目的Compressed Sparse Column Format (CSC)的目的是为了压缩矩阵,减少矩阵存储所占用的空间。这很好理解,手法无非就是通过增加一些”元信息”来描述矩阵中的非零元素存储的位置(基于列),然后结合非零元素的值来表示矩阵。这样在一些场景下可以减少矩阵存储的空间。

2018-01-31 10:33:39 352

原创 所有子集的和

给一整数 n,我们需要求前 n 个自然数形成的集合的所有可能子集中所有元素的和。写一个函数实现此功能。格式:输入第一行依次输入一个正整数 n,最后输出对应的 n 的所有子集中所有元素的和。样例输入n = 2n = 3样例输出624这

2018-01-23 15:54:35 453

原创 最大数字问题

给出两个长度分别是 m 和 n 的数组来表示两个大整数,数组的每个元素都是数字 0-9 。从这两个数组当中选出 k 个数字来创建一个最大数,其中 k 满足 k 格式:输入第一行依次两个数组,最后输出选出的最大数的数组。样例输入nums1 = [ 3,4,6,5 ]nums2 = [ 9,1,2,5,8,3 ]

2018-01-23 10:00:01 444

原创 数飞机

给出飞机的起飞和降落时间的列表,用 interval 序列表示. 请计算出天上同时最多有多少架飞机?写一个函数实现此计算过程。注意事项:如果多架飞机降落和起飞在同一时刻,我们认为降落有优先权。格式:输入第一行输入一个 interval 的序列数组,最后输出最多飞机的个数。样例输入[ [

2018-01-22 16:50:51 362

原创 SparkMllib GMM聚类算法的理解以及例子

在完成sparkMllib GMM算法例子之前需要知道几个概念。1、高斯分布、2、多维高斯分布。3、高斯混合分布。4、协方差GMM称为混合高斯分布,它在单高斯分布(又称正太分布,一维正太分布)的基础上针对多元变量发展出来的。(以下参考了百度词条内容)1)单高斯分布公式:,该公式的推导以及意义大家可以自行百度,这里只讲一下各个参数在公式中的意义:μ是正态分布的位置参数,描述正态分布的

2018-01-17 09:37:53 2212

原创 01背包问题

问题1:假设有10种宝物,没种宝物有无穷多个(意味着可以重复放入),每种物品的的重量分别是[0, 2, 3, 4, 5, 7, 10, 15, 18, 30, 39],它们的价值分别是[0, 3, 4, 5, 6, 9, 12, 16, 19, 31, 43],现在给你个承重为60的背包, 怎么装背包,可以才能带走最多的财富。(第0件作为一个补位数据,便于计算)问题2:假设有10件宝物,它们的

2018-01-16 08:00:56 288

原创 硬币找零的三种解答方案

设有N种面值的硬币,要求用最小的硬币数找M元零钱。这里给出三种解答:1、动态规划。2、贪婪、3、暴力搜索1、动态规划package my.dynamicprogram;public class DynamicSolveConitsProblem { /** * 只有三种硬币0是为了让数组在使用的时候下标从1开始算 */ public static final int[

2018-01-15 13:02:02 2895

原创 归并排序

无聊中写的归并排序算法。package my.sort;public class MergeSort { public static void main(String[] args) { int[] array = {9, 1, 5, 3, 4, 2, 6, 7, 10, 8, 3, 13, 44, 13, 17, 77, 44, 55, 23, 48, 112, 44, 55,

2018-01-12 11:44:13 130

原创 楼梯问题(续)

问题:1000级台阶,一个人一步可以走2级也可以一步走1级,如果这个刚好把这1000级走完,那么有多少中走法?思路。如果只有1级台阶,则走法只有一种。记作a(1)=1;          如果有2级台阶,则走法有两种。1、一次走两级。2、走两次一级。记作a(2)=2          如果有3级台阶,则走法有三种。走法靠自己脑补了,不再赘述。记作a(3)=3=a(2)+a(1) 

2018-01-12 07:36:16 231

原创 走楼梯的问题

问题:1000级台阶,一个人一步可以走2级也可以一步走1级,如果这个刚好把这1000级走完,那么有多少中走法?思路如下:该问题就是N个红色球和M个黑色球的组合问题。假设一个黑色球代表1级台阶,一个红色球代表2级台阶,那么1000级台阶,就是M+2*N= 1000。然后根据  (n≥m)公式计算出结果即可。假设M>=N代入公式中的n = M+1,m=N。这里大家想想为什么是M+1

2018-01-11 15:39:43 326 2

原创 Unsafe例子

java无法访问操作系统底层API,诸如释放内存、原子操作、线程的挂起以及获取字段的内存地址等等。但是强大的java并非完全屏蔽了所有的入口,Unsafe类就可以提供上述功能的操作。下面例子只是简单的获取了Unsafe类,并实现了获取字段地址,以及初始化对象,并通过内存地址的原子访问给对象赋值的过程。package com.my.springcloud.spark;import java.

2018-01-10 09:23:43 226 1

原创 spark LDA聚类算法的例子

LDA是狄利克雷分布算法,一般用于海量文档主题聚类。一般每个文档都有一个隐藏的主题,LDA算法就是找出可能性最高的几个主题。在找出主题的同时,也就找到了文档中每个单词在主题中的分布概概率。可以参考http://blog.csdn.net/qq_34531825/article/details/52608003下面是LDA算法的例子。该例子参考了官方网站中的例子。例子中的数据如下:0 1:1

2018-01-08 16:32:44 2035

原创 Spark K-Means 算法例子

k-means算法是以空间的点距离为基准,随机或者按照一定规则选择几个中心点数据,计算每个点到该几个中心点的距离,按照距离值最近归为一类的原则,把空间所有的点规则归为初始化的几个中心,称之为中心簇。 然后,找到每个中心簇的中心,再次计算空间所有的点到新的中心点的举例并归类,以此不断迭代,直到达到迭代次数或者点中心不再变化为止。kmeans_data.txt中的数据0.0 0.0 0.0 0.1

2018-01-03 15:06:49 2330

原创 Mahout基于物品的协同过滤算法例子

每行测试数据分别标识用户id(uid),物品id(itemid),评分(rating),评分时间(time) 464,2551,4,967174774 3464,1753,3,967247306 3464,144,5,967247759 3464,147,5,967247262 3464,2700,4,973282730 3464,2702,3,973282730 3464,3505

2017-12-28 16:31:55 2908 2

原创 Mahout基于用户的协同过滤算法的例子

每行测试数据分别标识用户id(uid),物品id(itemid),评分(rating),评分时间(time) 3464,2502,3,973282547 3464,3160,2,973282494 3464,2505,3,967175070 3464,1703,2,967248043 3464,1704,5,967246680 3464,3163,1,967174266 3464,23

2017-12-28 16:28:26 1721

原创 基于ALS算法电影推荐(java版)

基于ALS算法的最佳电影推荐(java版)package spark;import java.util.Arrays;import java.util.List;import org.apache.log4j.Level;import org.apache.log4j.Logger;import org.apache.spark.SparkConf;import org.apache.spa

2017-12-27 17:06:22 3444 3

原创 ALS算法的基本思想

SparkALS算法基本思想ALS算法是基于模型的推荐算法。起基本思想是对稀疏矩阵进行模型分解,评估出缺失项的值,以此来得到一个基本的训练模型。然后依照此模型可以针对新的用户和物品数据进行评估。ALS是采用交替的最小二乘法来算出缺失项的。交替的最小二乘法是在最小二乘法的基础上发展而来的。由于本人数学有限,就大体的介绍下最小二乘法的思想最小二乘法以下是用户A、B、C对物品A、B、C的打分 用户\物

2017-12-26 09:53:45 3924 1

原创 sparkALS算法例子

该例子援引的是http://files.grouplens.org/datasets/movielens/ 中ml-100k的数据,可以直接下载下来保存到本地,修改代码中的路径即可。package spark;import org.apache.spark.SparkConf; import org.apache.spark.api.java.JavaPairRDD; import org.a

2017-12-26 08:43:23 1559

原创 基于eclipse的spark开发环境搭建

第一次写博客,若有什么不到之处,还请大家见谅

2017-12-26 07:37:55 1492

nginx in action

关于nginx的资料文档,ngxin的安装和部署,以及实现原理。

2015-02-03

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除