自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1855)
  • 收藏
  • 关注

转载 遇见困难不用“怂”,机器学习的“万能药”:决策树

决策树是监督机器学习算法家族的一员,被认为是解决所有数据科学问题的万能药。数据科学家经常说一些俏皮话:"每当问题的陈述让你陷入困境,你想不出任何算法来解决它(不管情况如何),就使用决策树!"。通常情况下,无论是在行业中还是在kaggle比赛中,都可以看到决策树或者说至少是从它演变而来的算法(Bagging,Boosting ensemble)。决策树是一种多用途的机器学习方法,能够执行...

2018-12-03 13:54:45 241

转载 互联网巨头跑步入场,国内智能音箱真是扶不起的“阿斗”?

在智能音箱成为互联网巨头的“新宠”后,众多消费者与厂商都对这一领域投入相当多的关注度。此前CES中,谷歌就为自家智能音箱一番造势,国内小爱音箱的超低价格“赔本赚吆喝”也让智能音箱普及率攀升。从去年12月初至今年2月,智能印象普及率增加50%,随着亚马逊Echo的成功,智能音箱几乎已经成为互联网巨头的标配。相比海外热潮的智能音箱市场,中国市场的销量可以用惨淡来形容,根据GfK数据显示,201...

2018-12-03 13:52:49 232

转载 Google MapReduce到底解决什么问题?

第二篇,Google MapReduce架构启示(上)。很多时候,定义清楚问题比解决问题更难。什么是MapReduce?它不是一个产品,而是一种解决问题的思路,它有多个工程实现,Google在论文中也给出了它自己的工程架构实现。MapReduce这个编程模型解决什么问题?能够用分治法解决的问题,例如: ●  网页抓取 ●  日志处理 ●  索引倒排 ●  查询请求汇总 ...

2018-12-03 13:51:46 108

转载 “无状态”的那点事儿

软件大师正在闭目修炼, 最小的一名弟子慢慢走了进来。原文链接

2018-12-03 13:50:58 83

转载 今日头条大佬十年面试了 2000 人,总结了这 5 点!

大家好!各位都非常年轻,我今天来的时候挺有压力。因为我毕业快11年了,看到你们,真是觉得“长江后浪推前浪”。我去年参加了武汉的校招,感觉新一代年轻人的素质确实都非常好。我昨天就在想,今天应该跟大家分享什么。想了想,先把题目拟出来,把乔布斯的“Stay hungry, Stay foolish”,改成“Stay hungry, Stay young”。我想跟大家分享一下我自己毕业后的工作...

2018-12-03 13:49:49 999

转载 最新的15个Android库,你了解吗?

Android开发技术越来越成熟,Android开发工具当然也层出叠现。本文就向大家介绍今年最新的深受开发者喜爱的15个Android库。希望对你的[Android开发]工作能起到助力。1.MaterialStepperView它是用Material Design实现Steppers的。目前,Stepper只有垂直视图,但将来会有更多的风格。你可以尝试一下,如下图:原文链接...

2018-12-03 13:49:01 76

转载 Hystrix 停止开发。。。Spring Cloud 何去何从?

栈长得到消息,Hystrix 停止开发了。。。大家如果有对 Hystrix 不清楚的,请看下这篇文章:分布式服务防雪崩熔断器,Hystrix理论+实战。来看下 Hystrix 停止开发官宣:https://github.com/Netflix/Hystrix文中大概的意思是:Hystrix 不再继续开发了,目前的稳定版本 1.5.18 已经足够满足现有应用对 Hystr...

2018-12-03 13:46:57 384

转载 摸着石头过河:知乎核心业务 Go 语言改造实践

背景众所周知,知乎社区后端的主力编程语言是 Python。随着知乎用户的迅速增长和业务复杂度的持续增加,核心业务的流量在过去一年内增长了好几倍,对应的服务端的压力也越来越大。随着业务发展,我们发现 Python 作为动态解释型语言,较低的运行效率和较高的后期维护成本带来的问题逐渐暴露出来: 运行效率较低。知乎目前机房机柜空间已经不足,按照目前的用户和流量增长速度,可预见将在短期内服务...

2018-12-03 13:46:19 280

转载 LeetCode | 你不得不了解的哈希算法 !

⒈哈希是什么 ?问大家一个问题 。如果手机上存储了 1000 个联系人 ,现在要你给小詹打个电话 ,跟他说 ,他老婆喊他回家吃饭 。你会怎么做 ?当然是按姓名搜索呀 !(假装你有小詹电话号码~)言归正传 ,那你能想到这和哈希表有异曲同工之妙嘛 ?哈希表简单说可以理解成一个映射关系 ,类似 python 语法中字典的键值对 。根据键(Key)而直接访问在内存存储位置的数据结构。将任意...

2018-11-30 14:48:00 166

转载 Python技巧 | 一行代码减少一半内存占用

我想与大家分享一些我和我的团队在一个项目中经历的一些问题。在这个项目中,我们必须要存储和处理一个相当大的动态列表。测试人员在测试过程中,抱怨内存不足。下面介绍一个简单的方法,通过添加一行代码来解决这个问题。图片的结果下面我来解释一下,它是如何运行的。首先,我们考虑一个简单的"learning"例子,创建一个Dataltem 类,该类是一个人的个人信息,例如姓名,年龄,地址等。...

2018-11-30 14:46:44 399

转载 手把手教你如何用Python从PDF文件中导出数据(附链接)

有很多时候你会想用Python从PDF中提取数据,然后将其导出成其他格式。不幸的是,并没有多少Python包可以很好的执行这部分工作。在这篇贴子中,我们将探讨多个不同的Python包,并学习如何从PDF中提取某些图片。尽管在Python中没有一个完整的解决方案,你还是应该能够运用这里的技能开始上手。提取出想要的数据之后,我们还将研究如何将数据导出成其他格式。让我们从如何提取文本开始学起!使...

2018-11-30 14:46:10 310

转载 【C#】【xUnit】【Moq】.NET单元测试Mock框架Moq初探!

在TDD开发模型中,经常是在编码的同时进行单元测试的编写,由于现代软件开发不可能是一个人完成的工作,所以在定义好接口的时候我们就可以进行自己功能的开发(接口不能经常变更),而我们调用他人的功能时只需要使用接口即可。但我们在编写自己的单元测试并进行功能验证的时候,如果接口的实现人还没有完成代码怎么办呢?一般我们可能会自己写一个模拟实现来进行单元测试,这就是我们经常所说的单元测试中的Stub和Moc...

2018-11-30 14:44:02 3246

转载 配置HTTPS加密的快速参考指南

Nginxssl_protocols TLSv1 TLSv1.1 TLSv1.2阿帕奇SSLProtocol All -SSLv2 -SSLv3密码套房选择密码套件可能很困难,它们的名称可能看起来很复杂,但可以很容易地分解成它们的组件。采取以下套房:TLS_ECDHE_ECDSA_WITH_AES_128_GCM_SHA256组件是:TLS - the protoco...

2018-11-30 14:35:40 250

转载 小程序页面返回刷新数据onLoad和onShow页面传参解决

三种场景一、index页面不需要识别不同入口二、有很多页面“跳转”到B页面,所以onLoad需要接收url传参,识别不同入口。在只有A页面是“返回”的情况,可以固定写法onShow加载this.onLoad({route:'a'})三、如果有多页面“跳转”或“返回”index页面的情况,在需要返回的页面设置同名本地存储,index页面onShow获取本地存储来识别不同入口原文链接...

2018-11-30 14:31:06 11365

转载 C# 调用C++ DLL

总结遇到的引用各种问题:(建议使用x86的编译方式)​[DllImport(@"XXX.dll", EntryPoint = "TOEC_ComInit", CharSet = CharSet.Ansi, ExactSpelling = false, CallingConvention = CallingConvention.Cdecl)]public static extern int...

2018-11-30 14:30:00 116

转载 MySQL · 最佳实践 · 如何索引JSON字段

概述MySQL从5.7.8起开始支持JSON字段,这极大的丰富了MySQL的数据类型。也方便了广大开发人员。但MySQL并没有提供对JSON对象中的字段进行索引的功能,至少没有直接对其字段进行索引的方法。本文将介绍利用MySQL 5.7中的虚拟字段的功能来对JSON对象中的字段进行索引。示例数据我们将基于下面的JSON对象进行演示{ "id": 1, "nam...

2018-11-30 14:28:43 141

转载 蚂蚁金服 Service Mesh 渐进式迁移方案|Service Mesh Meetup 实录

大家好,今天给大家带来的演讲主题是《蚂蚁金服 Service Mesh 渐进式迁移方案》,给大家介绍一下我们蚂蚁金服主站的 Service Mesh 迁移方案,在稍后的内容中我会给大家解释什么是“渐进式”。今天的演讲方式有些特殊,将会是两位讲师合作。我是敖小剑,来自蚂蚁金服中间件团队,另外一位讲师 龙轼 ,来自 UC 基础研发部。Service Mesh 演进路线今天的内容将会有四块主...

2018-11-30 14:28:05 142

转载 RAID磁盘阵列——扫盲篇

在单机时代,采用单块磁盘进行数据存储和读写的方式,由于寻址和读写的时间消耗,导致I/O性能非常低,且存储容量还会受到限制。另外,单块磁盘极其容易出现物理故障,经常导致数据的丢失。因此大家就在想,有没有一种办法将多块独立的磁盘结合在一起组成一个技术方案,来提高数据的可靠性和I/O性能呢。在这种情况下,RAID技术就应运而生了。一、RAID 是什么?RAID ( Redundant A...

2018-11-30 14:27:25 505

转载 程序员如何做好应聘?简历、面试和Offer

其实每个工程师都讨厌Bug、代码不整洁、性能太差、用户界面不人性化等,这些都是一些技术细节,是可以慢慢体会和提高,总能找到答案去改进的。但在工作中,我应该学习和使用什么样的技术?为什么要自动化测试?如何搭建一个产品,看起来比较靠谱?我怎么去选择一份工作?如果我在一家大公司工作,如何跳槽到创业公司?我如何谈判取得更多的薪金或奖金?什么是股票激励?这些问题倒是更棘手,本文将给出一些介绍和辅助工具。...

2018-11-29 14:06:49 89

转载 8个Python高效数据分析的技巧

不管是参加Kaggle比赛,还是开发一个深度学习应用,第一步总是数据分析。这篇文章介绍了8个使用Python进行数据分析的方法,不仅能够提升运行效率,还能够使代码更加“优美”。一行代码定义List定义某种列表时,写For 循环过于麻烦,幸运的是,Python有一种内置的方法可以在一行代码中解决这个问题。下面是使用For循环创建列表和用一行代码创建列表的对比。 x =...

2018-11-29 14:05:30 83

转载 国内云数仓排行独占一档,揭秘阿里云EB级大数据计算引擎MaxCompute

日前,全球权威咨询与服务机构Forrester发布了《The Forrester WaveTM: Cloud Data Warehouse, Q4 2018》报告。这是Forrester Wave首次发布关于云数仓解决方案(Cloud Data Warehouse,简称CDW)的测评。报告对云数仓的当前产品功能、产品路线和发展策略、市场表现等几个方面进行全面的评估,在产品能力排行榜中,阿里云力压微...

2018-11-29 14:04:00 237

转载 强强联合!SAP x 阿里云联合发布"SAP在云端"计划

2018广东云栖大会名为”SAP在云端”的计划由阿里云与SAP联合发布启动这项计划除了企业日益增长的数字化转型需求还因为企业IT职能需求从面向流程管理到面向盈利能力转变图为阿里云战略部SAP业务总监张泽坤(左)、SAP中国区合伙人蒋骧慧SAP与阿里云作为主导,将会携手各个知名SAP合作伙伴进行深度合作,三方整体优势结合为客户能够平滑过渡完成以S/4HANA为核心...

2018-11-29 14:03:28 164 1

转载 用Python实现手机抓包,获取当当图书差评数据!

在这个万物互联的时代,手机端(App)、电脑端(Web),连接着你我他。本次学习了手机抓包的相关知识,了解了Charles-mitmproxy-Appium的基本使用,通过对当当图书评论的爬取,得以实践。那么就让我们来看看当当图书「活着」的差评吧!/ 01 / CharlesCharles是一个APP抓包工具,与我之前最先使用的Filddler相似,可以得到手机App运行过程中发生...

2018-11-29 14:02:41 146

转载 面向高维稀疏数据场景,阿里妈妈宣布开源XDL深度学习框架

据介绍,作为阿里巴巴旗下的大数据营销平台,阿里妈妈基于自身广告业务自主研发了深度学习框架X-Deep Learning(XDL),且已经大规模部署应用在核心生产场景。阿里妈妈表示,这也是业界首个面向高维稀疏数据场景的深度学习开源框架,突破了现有深度学习开源框架大都面向图像、语音等低维连续数据而设计的现状。数据的高维稀疏性既是阿里妈妈业务场景的重要特征,也是互联网的众多核心应用场景(如广告/...

2018-11-29 14:02:06 397

转载 Java架构-一些设计上的基本常识

最近给团队新人讲了一些设计上的常识,可能会对其它的新人也有些帮助, 把暂时想到的几条,先记在这里。1、API与SPI分离框架或组件通常有两类客户,一个是使用者,一个是扩展者。 API(Application Programming Interface)是给使用者用的, 而SPI(Service Provide Interface)是给扩展者用的。 在设计时,尽量把它们隔离开,而不要混在一起...

2018-11-29 14:01:13 134

转载 人生苦短,用Python来场烟花吧!!!

俗语有言,代码如诗;我也有言,代码如画!今天就和大家一起探讨下如何用python点烟花,让我们在工作之余可以随时用程序为自己放一场烟花秀。做一个这样有趣的小项目并不复杂,只需一点可视化技巧,100余行Python代码和程序库Tkinter,最后我们就能达到下面这个效果:整体概念梳理我们的整个理念比较简单。原文链接...

2018-11-29 14:00:22 1536 1

转载 数据科学家需要了解的5大聚类算法

聚类是一种涉及数据点分组的机器学习技术。给定一个数据点集,则可利用聚类算法将每个数据点分类到一个特定的组中。理论上,同一组数据点具有相似的性质或(和)特征,不同组数据点具有高度不同的性质或(和)特征。聚类属于无监督学习,也是在很多领域中使用的统计数据分析的一种常用技术。本文将介绍常见的5大聚类算法。K-Means算法K-Means算法可能是最知名的聚类算法,该算法在代码中很容易理解和实现。...

2018-11-29 13:59:46 141

转载 JavaWeb项目架构之NFS文件服务器

NFS简介NFS(Network File System)即网络文件系统。主要功能:通过网络(局域网)让不同的主机系统之间可以共享文件或目录。主要用途:NFS网络文件系统一般被用来存储共享视频,图片,附件等静态资源文件。NFS存储服务无NFS文件共享存储当用户A通过互联网上传文件时,经过负载均衡,随机或者定向分配到某个节点。但是当用户B去下载这个文件的时候,并不确定会向哪个...

2018-11-29 13:59:07 144

转载 数据结构——图的广度遍历

图的广度遍历和深度遍历思想不一样。后者是用递归的方法来实现的,这个是要借助队列来实现的。实现的基本思想如下:1、从图中某个顶点V0出发,并访问此顶点;2、从V0出发,访问V0的各个未曾访问的邻接点W1,W2,…,Wk;然后,依次从W1,W2,…,Wk出发访问各自未被访问的邻接点;3、重复步骤2,直到全部顶点都被访问为止。广度优先遍历是以层为顺序,和树的层次遍历差不多,是将某一层上的所有节点...

2018-11-28 14:43:39 315

转载 深度学习参数怎么调优,这12个trick告诉你

1:优化器。机器学习训练的目的在于更新参数,优化目标函数,常见优化器有SGD,Adagrad,Adadelta,Adam,Adamax,Nadam。其中SGD和Adam优化器是最为常用的两种优化器,SGD根据每个batch的数据计算一次局部的估计,最小化代价函数。学习速率决定了每次步进的大小,因此我们需要选择一个合适的学习速率进行调优。学习速率太大会导致不收敛,速率太小收敛速度慢。因此SGD通...

2018-11-28 14:42:15 710

转载 Redis热点Key发现及常见解决方案!

一、热点Key问题产生的原因1、用户消费的数据远大于生产的数据(热卖商品、热点新闻、热点评论、明星直播)。在日常工作生活中一些突发的的事件,例如:双十一期间某些热门商品的降价促销,当这其中的某一件商品被数万次点击浏览或者购买时,会形成一个较大的需求量,这种情况下就会造成热点问题。同理,被大量刊发、浏览的热点新闻、热点评论、明星直播等,这些典型的读多写少的场景也会产生热点问题。2、请...

2018-11-28 14:40:58 541

转载 HBase实操 | 如何使用Java连接Kerberos的HBase

一.文档编写目的出于CDH集群安全考虑,在CDH集群中增加了Kerberos认证机制。因为HBase的存储系统是基于Hadoop的存储,所以通过HBase客户端访问HBase数据库时需要进行身份认证。在Linux下使用HBase客户端访问HBase数据时需要先kinit初始化Kerberos账号,认证完成后我们就可以直接使用HBase shell操作HBase了。通过Linux的Kinit命令...

2018-11-28 14:39:22 907

转载 windows下的mysql安装

在musql的目录新建一个my.ini,内容如下[mysql]设置mysql客户端默认字符集default-character-set=utf8 [mysqld]设置3306端口port = 3306设置mysql的安装目录basedir=c:mysqlmysql-5.7.17-winx64设置mysql数据库的数据的存放目录datadir=c:mysqlmy...

2018-11-28 14:38:46 86

转载 Markdown指南

Markdown是一套简洁可读性极好的标记语言,非常适合用来写作。云栖社区支持标准语法和GFM语法,详细参考如下:社区Markdown编辑器的快捷键菜单栏目前不是很完善,我们的程序员小哥哥还在修复中······ 强烈推荐使用以下编辑语法哦~Markdown编辑界面选择Markdown编辑界面如下图所示,左侧为编辑区域,右侧为预览区域,您在左侧输入 Markdown 语法的文本,...

2018-11-28 14:37:47 101

转载 到底是 Java 好还是 Python 好?

语言的优劣之争是个永恒的话题,有时候一次偶然地“擦枪走火”甚至可能会引发一场铁杆粉丝之间的“战争”。也经常有人问我:“老刘,到底是Java好还是Python好? 我应该学习哪个语言?”我也挺为难的,只好说道:Python挺适合入门的,看起来很简单,适合创业团队,可以快速开发,快速上线,快速迭代。适合特种部队的突袭。等到发展到一定规模,动态语言的劣势就会体现出来,维护/重构难度高,特别是...

2018-11-28 14:36:41 374 1

转载 算法的一些概念

通俗的讲,算法可以理解为一个完整的解题步骤,由一些基本运算和规定的运算顺序构成 数据结构是数据的组织形式,可以用来表现特定的对象数据,再简单的来说数据结构就是关系,就是数据元素相互之间存在的一种或多种特定关系的集合,比如你有基友有朋友,这就是你自己的一种结构关系 数据结构分为逻辑结构和物理结构 逻辑结构:是指数据对象中元素之间的相互关系 物理结构:是指数据的逻辑结构在计算机中的存储...

2018-11-28 14:34:24 185

转载 【译】用JavaScript写一个区块链

几乎每个人都听说过像比特币和以太币这样的加密货币,但是只有极少数人懂得隐藏在它们背后的技术。在这篇博客中,我将会用JavaScript来创建一个简单的区块链来演示它们的内部究竟是如何工作的。我将会称之为SavjeeCoin!全文分为三个部分:part1:实现一个基本的区块链 part2:实现POW part3:交易与挖矿奖励Part1:实现一个基本的区块链区块链区块链是由一个...

2018-11-27 14:10:04 167

转载 linux实用(大数据必备干货)

vim实用a 在光标后一位开始插入A 在改行最后插入I 在改行最前面插入gg 直接跳到文件的首行G 直接跳到文件的末行dd 删除行, 5dd 则一次删除光标后的5行yy 复制当前行, 5yy则一次复制光标后的5行p 粘贴v 进入字符选择模式,选择完成后。按y复制,p粘贴control/ctrl+v 进入块选择模式,选择完成后。按y复制,p粘贴shift+...

2018-11-27 14:09:03 147

转载 机器学习、数据科学、人工智能、深度学习和统计学之间的区别

机器学习、数据科学、人工智能、深度学习和统计学之间的区别是什么? 数据科学是个广义的学科, Analytics data scientist(Type A)和Builder data scientist(Type B)有所不同,Type A Data Scientists在工作中遇到数据相关时可以写出不错的代码,但是并不必须是专家,这类data scientist可能专业是实验设计、预...

2018-11-27 14:07:28 482 1

转载 Python进行数据可视化分析快速教程实例

Jupyter Notebook介绍Jupyter Notebook是一个交互式笔记本,支持运行 40 多种编程语言。IPython notebook 是一个基于 IPython REPL 的 web 应用,安装 IPython 后在终端输入 ipython notebook 即可启动服务。jupyter 是把 IPython 和 Python 解释器剥离后的产物,将逐渐替代 IPython ...

2018-11-27 14:06:07 298

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除