自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

咖啡男孩之SRE之路

Spinnaker_CN的布道者

  • 博客(26)
  • 资源 (58)
  • 收藏
  • 关注

原创 朴素贝叶斯算法

朴素贝叶斯与前一篇ID3决策树最大的不同之处是前者是给出最大可能性结果的猜想和概率,后者是“武断”的给定唯一分类结果。我们称之为“朴素”,是因为整个形式化过程只做原始、简单的假设。贝叶斯决策理论的核心思想,即选择具有高概率的决策。我们先加深下贝叶斯公式的了解,贝叶斯是基于概率的机器学习的基石。事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一样的;然而,这两者是有确定的关系...

2017-12-29 23:32:59 1026

原创 ID3算法决策树

决策树 优点:计算复杂度不高,输出结果易于理解,对中间值的缺失不敏感,可以处理不相关特征数据。缺点:可能会产生过度匹配问题。适用数据类型:数值型和标称型 本篇介绍的是ID3算法决策树,ID3算法局限性只能划分标称型数据集,最终会被明确划分到某个分类中,在后面的代码中可以看得出是如何实现的。 决策树算法就是不断的判断和分支,但是数据有N列特性,这些特性进行判断的先后顺序就决定了决策算法的好坏。在划分...

2017-12-26 22:57:06 584

原创 k-近邻算法及代码

PS:本文中的大部分代码和案例数据来自《机器学习实践》这本书,但是原文中代码几乎没有注解,直接阅读难度很大,我在调试时增加了更详细的注解和步骤上的描述,方便理解。k-近邻算法原理是存在一个训练集,并且训练集中每个数据都存在标签,即我们知道样本集中每一数据与所属分类的对应关系。输入没有标签的新数据后,将新数据的每个特征与样本集中数据对应的特征进行比较,然后算法提取样本集中特征最相似数据(最近邻)...

2017-12-25 22:24:03 2540

原创 机器学习入门前准备

本文主要介绍机器学习的意义、必备概念、开发步骤、基本公式、矩阵和高阶数组

2017-12-25 22:19:16 1903

转载 PIL的基本概念

一篇介绍PythonPIL扩展包的博文,转自http://blog.csdn.net/icamera0/article/details/50647465

2017-12-25 17:51:04 780

原创 Java转Python之并发

对于Java语言我们没得选,并发只能用多线程。但是对于Python语言当我们有的选的时候,先看规模,规模都很大的情况下如果不需要考虑数据共享,尽量用多进程,因为在分布式、微服务流行的年代,通过添加PC的方式进程数的限制不再成为瓶颈,为何不用更稳定的方式呢;如果要考虑数据共享先分析通过数据同步方式能否低消耗的解决,能解决还是用多进程,代价很大就用多线程。当然了运算规模很小,需要快餐式消费,还是多线程开销更小。

2017-12-21 17:13:22 797

原创 Java转Python之面向对象编程

Python的OO和Java的OO跨度不大,最大的区别就是多继承会带来一些变化,但是只要理解了继承的顺序使用多集成时需要注意的地方也很清晰。

2017-12-20 17:55:10 750

原创 OAuth2.0与SSO比较

OAuth2.0网上资料经常拿来跟SSO混为一谈,个人觉得这两个概念一定要区分开,根本是两回事。SSO是为了解决一个用户在鉴权服务器登陆过一次以后,可以在任何应用中畅通无阻,一次登陆,多系统访问,操作用户是实打实的该应用的官方用户,用户的权限和分域以鉴权服务器的存储为准。OAuth2.0解决的是通过令牌获取某个系统的操作权限,因为有clientId的标识,一次登陆只能对该系统生效,第三方应用的操作用户不是鉴权系统的官方用户,授权权限鉴权中心可以做限制。

2017-12-19 21:14:40 16976

原创 Java转Python入门之IO

本篇以Java视角介绍了Python的键盘输入、文件操作、Json序列化、socket编程

2017-12-17 14:33:32 298

原创 Java转Python之函数、模块和异常处理

通过比较Java与Python在模块、函数、异常方面的异同点,方便Java技术人员更快速的适应Python开发

2017-12-16 16:39:48 433 1

原创 索引的类型与详解

首先强调一点,很多人认为索引是DBA那种角色做系统优化的时候才用得到,跟程序员没关系,所以不需要很深刻的掌握,只需要操作数据库时候会用就好。这个观点是大错特错的!索引是一种数据结构,不只是应用于数据库,而数据结构是程序开发人员必须掌握的一门技能,数据结构的学习将会充满整个职业生涯。

2017-12-16 11:35:59 512

原创 关于MQ的总结归纳

架构角度、业务角度、优缺点角度理解MQ以及MQ的应用场景

2017-12-14 21:59:04 676

原创 ThreadLocal-单例模式下高并发线程安全

为了解决线程安全的问题,我们有3个思路:第一每个线程独享自己的操作对象,也就是多例,多例势必会带来堆内存占用、频繁GC、对象初始化性能开销等待等一些列问题。第二单例模式枷锁,典型的案例是HashTable和HashMap,对读取和变更的操作用synchronized限制起来,保证同一时间只有一个线程可以操作该对象。虽然解决了内存、回收、构造、初始化等问题,但是势必会因为锁竞争带来高并发下性能的下降。第三个思路就是今天重点推出的ThreadLocal。单例模式下通过某种机制维护成员变量不同线程的版本。

2017-12-14 20:57:36 7493 3

原创 排序算法的详解与总结

1 凡是不需要创建临时控件,通过指针变动位置互换就可以完成的排序,空间复杂度最低,只有O(1)2 凡是按照固定的套路元素两两比较直到结束的,时间复杂度最高,是O(n^2),像冒泡排序、简单选择排序就属于这种排序。3 选择排序方法第一优先是业务,也就是稳定性;第二优时间复杂度不能太差,剩下的取时间和空间的平衡。

2017-12-11 18:08:01 408

原创 基数排序

该算法不仅使用在数字排序上,多维度元素的排序只要合理的建模都可以用基数排序,例如扑克牌中花色代表一个维度,个位数代表一个维度,十位数代表一个维度,十位相等比个位;个位相等比花色。

2017-12-11 17:59:29 304

原创 堆排序

将所有序列构建成一个完全二叉树,然后将完全二叉树构造成大堆顶或者小堆顶。以小堆顶为例,要求二叉树中所有节点必须小于自己的左右两个叶子节点,用数学公式表达就是:k(n)<=k(2n+1) && k(n)<=k(2n+2) 当一轮堆排序完成后,堆顶就是该序列最小值。此时将堆顶元素取走,对剩下的n-1个元素再做一轮堆排序,直到全部元素从堆顶吐出。 小堆顶取值,则整个序列是倒序排列;大堆顶取值,则整个序列是正序排列。 核心问题有2个,第一:如何对无序的堆进行排序;第二:吐出堆顶后二叉树被破坏,如果重新构建这个二

2017-12-10 22:51:09 435

原创 归并排序

相邻两个元素二二合并形成一个小序列进行比较,合并一轮后再两个子序列二二合并形成更大的子序列进行排序,中间过程中遇到单个的子序列则等到下一个合并周期,直到所有序列合并成一个总序列,排序后结束。

2017-12-09 19:12:29 224

原创 快速排序详解与实现

选一个序列中的值,所有元素跟这个值做比较,序列被分为两部分,然后对剩下每部分继续做相同操作。 快排随机性很大,跟选取的值有关系,每次选值有可能将序列平均分为两份,也有可能做了无用功选取了最大或者最小的那个值,所以时间消耗上随机性很大.

2017-12-09 12:49:54 348

原创 冒泡排序

序列中相连的元素从左到右两两做比对和位移,[0,1]、[1,2]、[2,3]……[n-1,n],比对完一轮后最大的(或最小的)就落到了队尾,对剩下的n-1个元素继续做相同操作,直到结束。每次比对关注的值越来越大,最终露出水面,所以很形象的称为冒泡排序。时间复杂度方面,冒泡复杂而且稳定,不会因数据的随机性而变化,比对次数=(n-1)+(n-2)+…+(n-n+1)=(n^2)/2-n/2,所以复杂度O(n^2) 稳定性方面我们可以控制冒泡的规则,不打破相等数值原来的相对位置,所以是稳定的. 空间复杂度

2017-12-08 19:19:23 219

原创 简单选择排序和二元选择排序

简单选择排序在整个数组中选取最小值替换队首,再对剩下的n-1个元素选取最小值,依此类推直至结束。二元选择是对简单排序的优化,每次选取最小最大两个极限值分别放在队首和队尾的位置,整个序列两头有序中间无序。二元选择减少了对无序部分的便利次数,复杂度和稳定性跟简单选择排序一样.

2017-12-07 22:55:58 589

原创 希尔插入排序:

按一定跨度d两两进行比对并按序交换位置,进行完一轮比对后跨度缩小再进行下一轮,经过几轮后先将整个序列变成部分有序,然后再进行直接插入排序,减少直接插入排序的开销。希尔算法涉及到2个概念,跨度和深度,跨度一般我们选取总长度n的一半,下一轮再减半,也就是[n/2,n/4,n/8,…],深度根据序列元素的大小自己设置,深度越深希尔算法消耗越大,但是希尔后的列表越趋近有序,直接查插入时消耗越小,极限情况下希尔排序后序列已经完全有序,直接插入消耗约等于零。

2017-12-07 22:28:20 603

原创 直接插入排序

从第一个元素开始,被认为是一个有序的序列,剩下的元素按位置顺序逐一与前面的有序序列进行比对并按序插入到序列中。这样序列首部从小大到序列在增长,序列尾部无序的部分在削减,直到最尾部一个元素比对结束后,整个序列变成有序。

2017-12-07 22:07:45 219

原创 详解Https出现的前因后果

虽然自己不直接从事互联网行业,但是对互联网行业的技术一直没有放松学习,特别是安全方面一直是我薄弱的方面,所以最近踏下心来好好的研究了下互联网安全方面的内容。网上关于SSL、Https的学习资料比较多,有些讲的太宽泛,有些讲的又不容易理解,我以自己的角度和自己的顺序来好好摸清这些内容。 首先澄清3个概念:SSL、TLS、Https。SSL:Secure Sockets Layer,中...

2017-12-05 18:51:46 765

原创 Python验证RSA非对称加密

加密方式从密钥是否相同的角度分为对称加密和非对称加密。对称加密:“加密”和“解密”使用【相同的】密钥。非对称加密:“加密”和“解密”使用【不相同的】密钥。非对称加密服务端生成一对密钥(公钥和私钥),将公钥公开给访问者,要求访问者通过公钥来加密,自己通过私钥来解密。从效率上来讲,对称加密速率快很多,但是密钥的保存和传输的安全性成了很大的风险;而非对称加密只传输公钥,没有私钥是无法解开密文的,所以安全性更高,但是开销更大。现阶段流行的非对称加密是RSA加密,本文主要解释下RSA非对称加密,并用Pyt

2017-12-04 18:27:07 968 2

原创 Java转Python入门之运算与循环

做Java有很多年,做到后面发现Java在后台业务处理、微服务架构、系统框架建设等方面有突出的优点,但是在某些方面确实疲软,例如在研究机器学习时一些发杂的运算和演练用Java写起来费劲甚至基本写不出来,所以需要一种跟精进的脚本语言帮助做运算,所以选择转学Python,第一两条腿走路在研发这行能走得更远,第二利用Python敲开机器学习的大门,开拓自己的视野和事业。

2017-12-03 19:25:51 1076 1

原创 Java基础学Python之环境与语法

做Java有很多年,做到后面发现Java在后台业务处理、微服务架构、系统框架建设等方面有突出的优点,但是在某些方面确实疲软,例如在研究机器学习时一些发杂的运算和演练用Java写起来费劲甚至基本写不出来,所以需要一种跟精进的脚本语言帮助做运算,所以选择转学Python,第一两条腿走路在研发这行能走得更远,第二利用Python敲开机器学习的大门,开拓自己的视野和事业。

2017-12-01 22:24:50 591

2.阿里云异地多活与冲突解决.pdf

不管哪种数据库,异地多活一直都是给头疼的问题,让我们一起看下案例云在redis异地多活方面是怎么解决的。

2020-07-22

ChaosBlade项目外部分享.pdf

阿里云ChaosBlade项目分享,了解ChaosBlade运行原理以及阿里这方面想要打造的生态圈,ChaosBlade解决了混沌工程中故障注入部分的实现。

2020-07-22

数智化时代下购物中心运营模式新探索.pdf

2019云栖大会-数智化时代下购物中心运营模式新探索,又是一片关于新零售+人工智能的实践贴,受益匪浅。

2020-07-21

视频内容理解的研究与实践.pdf

2019云栖大会-视频内容理解的研究与实践,讲解了多维视频的发展历程和AI媒体的系统基本组成,推荐流媒体行业必读。

2020-07-21

深度学习在线下场景的探索与实践-云栖大会.pdf

2019云栖大会-深度学习在线下场景的探索与实践,讲真,我没怎么看到这一篇文章,主要是对硬件,特别是智能芯片这一领域了解的太少了。

2020-07-21

容器混合云趋势与展望.pdf

2019云栖大会-容器混合云趋势与展望,这一片是我在现场听的,rancher大中华总经理为你讲解容器混合云的前景。

2020-07-21

人工智能赋能升级线下零售.pdf

2019云栖大会-人工智能赋能升级线下零售,人工智能领域下的新零售,看完后不禁感叹,科技改变商业,科技改变生活。

2020-07-21

千万级用户-亿级请求的平台架构演变.pdf

2019云栖大会-企业应用迁云的全链路评估方案,比较硬的一篇文章,讲述了随着用户数发展,架构优化优化再优化的过程

2020-07-21

企业应用迁云的全链路评估方案.pdf

2019云栖大会-企业应用迁云的全链路评估方案,企业上云的痛点和步骤,帮助我们了解迁移到云端遇到的问题以及解决方案。

2020-07-21

企业级数据库敏捷研发模式.pdf

2019云栖大会-企业级数据库敏捷研发模式,敏捷开发不是新词,但是数据库敏佳开发确实让人听完眼前一亮的感觉。

2020-07-21

面向失败设计.pdf

2019云栖大会-面向失败设计,最爱面向失败的设计理念,什么都不能相信,只能相信自己的架构,所以一起来学习下吧

2020-07-21

利用ADB打造游戏行业新一代实时数据运营平台.pdf

2019云栖大会-利用ADB打造游戏行业新一代实时数据运营平台,架构比较好理解,属于了解实时分析架构的入门实战材料。

2020-07-21

集成智能接入网关APP:优化企业级移动办公网络.pdf

2019云栖大会-集成智能接入网关APP:优化企业级移动办公网络,让网络更简单,让网络更基础,这是对未来网关APP的基本要求。

2020-07-21

基于数据湖的精准广告投放系统技术解密.pdf

2019云栖大会-基于数据湖的精准广告投放系统技术解密,广告时代已过去,窄告时代已来临,如何利用技术手段做好精准营销。

2020-07-21

基于视觉推理的视频理解.pdf

2019云栖大会-基于视觉推理的视频理解,了解图神经网络的基本模型和应用场景,其中推理模型属于图神经里比较高深的知识点。

2020-07-21

混合云网络2.0:云网一体 助力企业平滑上云.pdf

2019云栖大会-混合云网络2.0:云网一体 助力企业平滑上云,大家一起来了解下混合云正确打开方式吧

2020-07-21

关于网络嵌入和图卷积神经网络的一些思考.pdf

2019云栖大会-关于网络嵌入和图卷积神经网络的一些思考,清华大学崔鹏关于卷积网络深蹲学习领域的技术分享。

2020-07-21

分析型数据库标准发展与行业观察.pdf

2019云栖大会-分析型数据库标准发展与行业观察,除开关系型、NoSql型、时序型,我们又接触的新一类数据库类型。

2020-07-17

低成本自动三维室内重建系统.pdf

2019云栖大会-低成本自动三维室内重建系统,房屋拍卖,企业实景认证,都需要这种黑科技,大家一起来了解下吧。

2020-07-17

传统数据库DBA到开源的技能和心理切换.pdf

2019云栖大会-传统数据库DBA到开源的技能和心理切换,面向开源,拥抱开源,提升自己,面对调账,DBA成长之路。

2020-07-17

超大规模图神经网络实践.pdf

2019云栖大会-超大规模图神经网络实践,大家一起来了解阿里巴巴人工智能经济体系以及面临的巨大挑战。

2020-07-17

阿里云Elasticsearch2.0发布.pdf

2019云栖大会-阿里云Elasticsearch2.0发布,推出云端ES的新特性,鼓励大家使用公有云的Paas服务

2020-07-17

阿里巴巴研发效能提升及业务创新实践.pdf

2019云栖大会-阿里巴巴研发效能提升及业务创新实践,一篇比较抽象的文章,从理论上讲解了如何提高企业效能的方法论。

2020-07-17

阿里巴巴神龙(X-Dragon)架构演进之路.pdf

2019云栖大会-阿里巴巴神龙(X-Dragon)架构演进之路,让我们一起来窥探阿里巴巴虚拟化架构飞升之路。

2020-07-17

Tableau带来实时数仓产品全新的洞察能力.pdf

2019云栖大会-Tableau带来实时数仓产品全新的洞察能力,数据文化的构建是企业转型数字化的润滑剂

2020-07-17

MPEG和AVS视频编码标准最新动态圆桌会.pdf

2019云栖大会-MPEG和AVS视频编码标准最新动态圆桌会,浙江大学教授与您一起分享视频编码领域最新黑科技。

2020-07-17

卓诗尼破局”数智“转型.pdf

2019云栖大会-卓诗尼破局”数智“转型,又是数智主力新零售的经典案例,而且案例讲解的很技术、很透彻。

2020-07-21

中间件助力云途时代应用上云.pdf

2019云栖大会-中间件助力云途时代应用上云,EDAS、SpringCloudAlibaba、PTS等阿里一些列黑科技助力应用上云。

2020-07-21

智能化压测-应用稳定性基石.pdf

2019云栖大会-智能化压测-应用稳定性基石,给的方法论比较多,也很具备参考价值,推荐大家学习~~。

2020-07-21

运营商如何实现大型企业大型企业应用上用云.pdf

2019云栖大会-运营商如何实现大型企业大型企业应用上用云,文章还是透露着传统行业那种朴实,对准备上云的企业有帮助,已经上云的可以不看

2020-07-21

云网络开放生态.pdf

2019云栖大会-云网络开放生态,阿里云不做Saas,阿里云让大家做更好的Saas,提供了一套混合云网络生态。

2020-07-21

云网络发展历程和未来展望.pdf

2019云栖大会-云网络发展历程和未来展望,云网一体化,网络AI话,内容还是空泛了些,名号上给足了胃口,但是内容没有讲透。

2020-07-21

云上应用生态全栈IPv6演进.pdf

2019云栖大会-云上应用生态全栈IPv6演进,本届大会关于IPV6为数不多的题材,我个人还是有点失望,毕竟ipv6这么火爆。

2020-07-21

云上应用高可用防护体系.pdf

2019云栖大会-云上应用高可用防护体系,了解阿里安全团队的这一套体系,对于系统架构师来说是一种升华,至少我学会很多。

2020-07-21

云上服务:超越硬件的稳定性.pdf

2019云栖大会-云上服务:超越硬件的稳定性,又是一篇现场聆听的课题,对于我这种软件工程师来说不明觉厉

2020-07-21

业务引领的DevOps.pdf

2019云栖大会-业务引领的DevOps,挂着Devops的名,其实内容比较宽泛,可能因为篇幅的原因,没有把这一领域讲透。

2020-07-21

万物互联时代的虚拟化技术.pdf

2019云栖大会-万物互联时代的虚拟化技术,一起来了物虚拟化的原因和背景知识,如何云化才是解决问题的关键。

2020-07-21

图像搜索与识别在大规模场景中的研究与实践.pdf

2019云栖大会-图像搜索与识别在大规模场景中的研究与实践,达摩院资深算法专家分享,满满干货,不要错过。

2020-07-21

图模型在阿里安全中的实践.pdf

2019云栖大会-图模型在阿里安全中的实践,人工智能在用户安全领域的应用,属于AI感知领域的应用场景

2020-07-21

数智化运营中的数据中台构建解析.pdf

2019云栖大会-数智化运营中的数据中台构建解析,2019年IT界最火的词可能是中台,本篇教你如何打造数据中台。

2020-07-21

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除