机器学习算法优缺点对比及选择

本文的目的,是务实、简洁地盘点一番当前机器学习算法。文中内容结合了个人在查阅资料过程中收集到的前人总结,同时添加了部分自身总结,在这里,依据实际使用中的经验,将对此模型优缺点及选择详加讨论。 主要回顾下几个常用算法的适应场景及其优缺点! 机器学习算法太多了,分类、回归、聚类、推荐、图像识别领域...

2019-04-29 17:10:29

阅读数 109

评论数 0

机器学习三要素:模型、策略与算法

机器学习三要素:模型、策略与算法 提到机器学习,这无疑是数据分析师最常提到的一个词儿了,机器学习也叫统计学习,即Statistics Learning。一些商学院常常讲的Business Intelligence或者Business Analytic基本上也就是这回事儿。机器学习在干嘛?就是...

2019-03-25 20:34:31

阅读数 151

评论数 0

InnoDB行格式对text/blob大变长字段的影响

1. InnoDB的Antelop与Barracuda文件格式 Innodb存储引擎保存记录,是以行的形式存放的(与之对应的是像Google BigTable这种列数据库)。在InnoDB 1.0.x版本之前,InnoDB 存储引擎提供了 Compact 和 Redundant 两种格式来存放行...

2019-03-23 22:55:17

阅读数 39

评论数 0

腾讯后台知识体系

2019-02-15 23:09:55

阅读数 179

评论数 0

技术选型:Sentinel vs Hystrix

  Sentinel 是阿里中间件团队研发的面向分布式服务架构的轻量级高可用流量控制组件,于今年7月正式开源。Sentinel 主要以流量为切入点,从流量控制、熔断降级、系统负载保护等多个维度来帮助用户提升服务的稳定性。大家可能会问:Sentinel 和之前经常用到的熔断降级库 Netflix ...

2019-01-27 22:08:45

阅读数 97

评论数 0

常用的服务发现对比(Consul、Zookeeper、Etcd、Eureka)

这里就平时经常用到的服务发现的产品进行下特性的对比,首先看下结论: Feature Consul zookeeper etcd euerka 服务健康检查 服务状态,内存,硬盘等 (弱)长连接,keepalive 连接心跳 可配支持 多数据...

2019-01-27 21:43:09

阅读数 139

评论数 0

知识图谱在大数据反欺诈领域的应用与实践

1、为什么要用大数据来反欺诈? 近些年来互联网金融蓬勃发展,特别是P2P的兴起,颠覆了传统的银行贷款模式,给大众带来快速便捷的金融服务;在P2P行业中,借款端的风险是P2P公司面临的主要风险,而借款端的风控水平可以说决定了一家P2P公司的核心竞争力。 借款端风险的一个主要来源是欺诈风险,传统的...

2019-01-27 21:28:29

阅读数 245

评论数 0

知识图谱已成 AI 下一风口,但你知道它进展到哪了吗?

知识图谱最初是由谷歌提出用来优化搜索引擎的技术,在不断发展中外延也一度扩大。盘点目前知识图谱的发展,其已经助力了很多热门的人工智能场景的应用,例如语音助手、聊天机器人、智能问答等。当前的人工智能其实可以简单划分为感知智能(主要集中在对于图片、视频以及语音的能力的探究)和认知智能(涉及知识推理、因果...

2019-01-06 22:54:15

阅读数 288

评论数 0

【干货】机器学习和深度学习概念入门

目  录 1   人工智能、机器学习、深度学习三者关系 2   什么是人工智能 3  什么是机器学习 4  机器学习之监督学习 5  机器学习之非监督学习 6  机器学习之半监督学习 7  机器学习之强化学习 8  什么是深度学习 9 总结     1人工智能、机器学习、深度...

2018-12-31 23:28:33

阅读数 320

评论数 0

这可能是最简单易懂的机器学习入门

本文用浅显易懂的语言精准概括了机器学习的相关知识,内容全面,总结到位,剖析了机器学习的what,who,when, where, how,以及why等相关问题。从机器学习的概念,到机器学习的发展史,再到机器学习的各类算法,最后到机器学习的最新应用,十分详尽。适合小白快速了解机器学习。   ...

2018-12-31 22:35:44

阅读数 311

评论数 0

图解数据分析师最常用的10个机器学习算法

在机器学习领域,有种说法叫做“世上没有免费的午餐”,简而言之,它是指没有任何一种算法能在每个问题上都能有最好的效果,这个理论在监督学习方面体现得尤为重要。 举个例子来说,你不能说神经网络永远比决策树好,反之亦然。模型运行被许多因素左右,例如数据集的大小和结构。 因此,你应该根据你的问题尝试许多...

2018-12-31 22:32:52

阅读数 103

评论数 0

轻松看懂机器学习十大常用算法

通过本篇文章可以对机器学习ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。 每个算法都看了好几个视频,挑出讲的最清晰明了有趣的,便于科普。 算法如下: 决策树 随机森林算法 逻辑回归 SVM 朴素...

2018-12-31 22:26:26

阅读数 131

评论数 0

图解机器学习

每当提到机器学习,大家总是被其中的各种各样的算法和方法搞晕,觉得无从下手。确实,机器学习的各种套路确实不少,但是如果掌握了正确的路径和方法,其实还是有迹可循的,这里我推荐SAS的Li Hui的这篇博客,讲述了如何选择机器学习的各种方法。 另外,Scikit-learn 也提供了一幅清晰的路线图给...

2018-12-30 23:55:44

阅读数 49

评论数 0

常见机器学习模型总结

一、机器学习模型按照可使用的数据类型分为监督学习和无监督学习两大类。   1-监督学习主要包括用于分类和用于回归的模型:     1)分类:线性分类器(如LR)、支持向量机(SVM)、朴素贝叶斯(NB)、K近邻(KNN)、决策树(DT)、集成模型(RF/GDBT等)     2)回归:线性回...

2018-11-30 23:58:24

阅读数 117

评论数 0

区块链简介

    区块链简介         区块链的概念         区块链的发展历史         区块链的特点         区块链的结构         区块链的应用         参考文献 区块链简介 区块链(blockchain)作为比特币的底层技术受到了越来越多的关注,其去中心化...

2018-10-29 21:31:37

阅读数 175

评论数 0

Linux虚拟化平台检测

要想找出 Linux 系统运行在虚拟化平台中还是硬件服务器上,有多种方式可供大家选择,这主要取决于你的 hypervisor 或 container 环境。不同的虚拟化或容器技术会在其实例中引入不同的识别指纹,如:处理器厂商、特殊的 /proc 文件或虚拟网卡名称等。 另外通过 dmesg 显示启...

2018-07-08 17:01:08

阅读数 747

评论数 0

Kubernetes入门简介

1. Kubernetes是什么?      首先,Kubernetes是一个全新的基于容器技术的分布式架构领先方案。Kubernetes是Google开源的容器集群管理系统,其提供应用部署、维护、 扩展机制等功能,利用Kubernetes能方便地管理跨机器运行容器化的应用,其主要功能如下:(1)...

2018-07-01 21:28:31

阅读数 1340

评论数 0

Docker基础原理

前言Docker和容器不是一个意思,Docker包含实现虚拟化技术的一系列技术,而容器(container)只是其中的一个组件。Docker可以给你带来什么?更快交付你的应用(Faster delivery of your applications)让部署和测试更简单(Deploying and ...

2018-06-30 15:27:24

阅读数 289

评论数 0

Docker入门简介

本文只是对Docker的概念做了较为详细的介绍,并不涉及一些像Docker环境的安装以及Docker的一些常见操作和命令。通过阅读本文你将知道一下概念:容器什么是Docker?Docker思想、特点Docker容器主要解决什么问题容器 VS 虚拟机Docker基本概念: 镜像(Image),容器(...

2018-06-30 14:18:34

阅读数 393

评论数 0

ElasticSearch入门简介

前言Elasticsearch 是一个建立在全文搜索引擎 Apache Lucene(TM) 基础上的搜索引擎,可以说 Lucene 是当今最先进,最高效的全功能开源搜索引擎框架。Elasticsearch是一个实时分布式和开源的全文搜索和分析引擎。 它可以从RESTful Web服务接口访问,并...

2018-06-24 18:08:32

阅读数 414

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭