排序:
默认
按更新时间
按访问量

机器学习分类算法常用评价指标

https://www.cnblogs.com/asialee/p/9800039.html 1. 准确率,召回率,精确率,F1-score,Fβ,ROC曲线,AUC值 为了评价模型以及在不同研究者之间进行性能比较,需要统一的评价标准。根据数据挖掘理论的一般方法,评价模型预测能力最广泛使用的是...

2018-10-17 01:42:11

阅读数:17

评论数:0

Hive 官方手册翻译 -- Hive DDL(数据定义语言)

https://www.cnblogs.com/fanzhenyong/p/9746796.html Hive 官方手册翻译 -- Hive DDL(数据定义语言) 目录 一、概述 二、关键词,非保留关键字和保留关键字 三、创建/删除/修改/使用数据库 3.1、 创建数据库 3...

2018-10-07 22:13:47

阅读数:43

评论数:0

SPARK2.1.0模型设计与基本架构(下)

SPARK2.1.0模型设计与基本架构(下) https://www.cnblogs.com/jiaan-geng/p/9708246.html 阅读提示:读者如果对Spark的背景知识不是很了解的话,建议首先阅读《SPARK2.1.0模型设计与基本架构(上)》一文。 SPARK模型设计 ...

2018-10-01 17:12:28

阅读数:27

评论数:0

Redis中单机数据库的实现

https://www.cnblogs.com/neooelric/p/9629948.html 1. 内存操作层 zmalloc 系接口 redis为了优化内存操作, 封装了一层内存操作接口. 默认情况下, 其底层实现就是最简朴的libc中的malloc系列接口. 如果有定制化需求, 可以通...

2018-09-12 00:03:12

阅读数:37

评论数:0

Quartz+Spring Boot实现动态管理定时任务

https://www.cnblogs.com/wujiwen/p/9615120.html 项目实践过程中碰到一个动态管理定时任务的需求:针对每个人员进行信息的定时更新,具体更新时间可随时调整、启动、暂定等。 思路 将每个人员信息的定时配置保存到数据库中,这样实现了任务的动态展示和管理...

2018-09-09 22:48:25

阅读数:81

评论数:0

金融数据分析与挖掘具体实现方法 -1

https://www.cnblogs.com/wf-skylark/p/9551967.html 有人让我写一下关于数据挖掘在金融方面的应用,再加上现在金融对数据方面的要求不断提高,准备用两篇随笔来做个入门总结。 首先,在看这篇随笔以前稍微补充一点金融方面的知识,因为我不是金融专业的,以下补...

2018-08-29 23:17:31

阅读数:47

评论数:0

基础爬虫架构有五大模块

https://www.cnblogs.com/guguobao/p/9544626.html 爬虫调度器:负责统筹其他四个模块的协调工作 URL管理器:管理URL链接,维持已经爬取的URL集合和未爬取的URL集合,提供新的URL链接接口 HTML下载器: 用于从URL管理器中获取未爬虫的U...

2018-08-27 21:29:41

阅读数:70

评论数:0

每秒高达1.6亿次操作的并发键值存储库 FASTER 诞生

https://www.cnblogs.com/xiaoliangge/p/9539735.html FASTER 在过去十年中,云中的数据密集型应用程序和服务有了巨大的增长。数据在各种边设施(例如,设备,浏览器和服务器)上创建,并由云应用程序处理用来获得数据价值或做出决策。应用程序和服务可以...

2018-08-27 21:02:32

阅读数:78

评论数:0

HBase性能调优总结

https://www.cnblogs.com/frankdeng/p/9529044.html 一. HBase的通用优化 1 高可用      在 HBase 中 Hmaster 负责监控 RegionServer 的生命周期,均衡 RegionServer 的负载,如果 Hmaster...

2018-08-25 23:17:07

阅读数:63

评论数:0

Raft协议的理解与分析

http://tech.dianwoda.com/2018/08/24/raftfen-bu-shi-zhi-xing-xie-yi/?utm_source=tuicool&utm_medium=referral  Paxos是最早的分布式一致性算法,虽然出来了很多年,但...

2018-08-25 11:51:34

阅读数:33

评论数:0

SparkSql学习笔记(包含IDEA编写的本地代码)

SparkSql学习笔记(包含IDEA编写的本地代码)   Spark SQL and DataFrame 1.为什么要用Spark Sql 原来我们使用Hive,是将Hive Sql 转换成Map Reduce 然后提交到集群上去执行,大大简化了编写MapReduce的程序的复杂性,由于M...

2018-08-22 22:55:41

阅读数:56

评论数:0

MyBatis 源码分析 - SQL 的执行过程

https://www.cnblogs.com/nullllun/p/9503612.html 本篇文章较为详细的介绍了 MyBatis 执行 SQL 的过程。该过程本身比较复杂,牵涉到的技术点比较多。包括但不限于 Mapper 接口代理类的生成、接口方法的解析、SQL 语句的解析、运行时参数的...

2018-08-21 00:11:38

阅读数:38

评论数:0

从oracle往greenplum迁移,查询性能不满足要求的定位以及调优过程

https://www.cnblogs.com/qiannianyuan/p/9463312.html​​​​​​​ 目录 一、前言 二、环境信息 三、优化过程 3.1 结果对比 3.2 分析过程 3.3 问题解决 3.4 最终结果  四、参考资料   回到顶部 ...

2018-08-13 01:13:42

阅读数:112

评论数:0

Hive(十)Hive性能优化总结

https://www.cnblogs.com/frankdeng/p/9463897.html 一、Fetch抓取   1、理论分析   Fetch抓取是指,Hive中对某些情况的查询可以不必使用MapReduce计算。例如:SELECT * FROM employees;在这种情况下...

2018-08-13 01:10:46

阅读数:253

评论数:0

Spark Streaming + Kafka集成指南

https://www.cnblogs.com/frankdeng/p/9308585.htmlKafka项目在版本0.8和0.10之间引入了一个新的消费者API,因此有两个独立的相应Spark Streaming包可用。请选择正确的包, 请注意,0.8集成与后来的0.9和0.10代理兼容,但0....

2018-07-16 00:39:11

阅读数:96

评论数:0

Spark(三)Spark之RDD

https://www.cnblogs.com/frankdeng/p/9301653.html一、RDD的概述1.1 什么是RDD?RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是Spark中最基本的数据抽象,它代表一个不可变、可分区、里面的元素可并行...

2018-07-14 00:38:19

阅读数:70

评论数:0

PgSQL · 特性分析 · MVCC机制浅析

https://yq.aliyun.com/articles/608911?spm=a2c4e.11153940.bloghomeflow.59.399d291acgr606PgSQL · 特性分析 · MVCC机制浅析摘要: 背景 我们在使用PostgreSQL的时候,可能会碰到表膨胀的问题(关...

2018-07-12 17:09:59

阅读数:171

评论数:0

go语言之行--网络编程、http处理流程详情

https://www.cnblogs.com/wdliu/p/9284459.html一、简介go语言中的网络编程主要通过net包实现,net包提供了网络I/O接口,包括HTTP、TCP/IP、UDP、域名解析和Unix域socket等。和大多数语言一样go可以使用几行代码便可以启动一个服务器,...

2018-07-09 21:52:49

阅读数:97

评论数:0

云主机搭建Kubernetes 1.10集群

https://www.cnblogs.com/aubin/p/9284633.html一、基础环境云主机下载软件包将所有软件下载至/data目录# 链接:https://pan.baidu.com/s/13DlR1akNBCjib5VFaIjGTQ 密码:1l69master到node做免密认证...

2018-07-09 21:48:02

阅读数:223

评论数:0

Spark MLlib 之 aggregate和treeAggregate从原理到应用

https://www.cnblogs.com/xing901022/p/9285898.html在阅读spark mllib源码的时候,发现一个出镜率很高的函数——aggregate和treeAggregate,比如matrix.columnSimilarities()中。为了好好理解这两个方法...

2018-07-09 21:45:29

阅读数:90

评论数:0

提示
确定要删除当前文章?
取消 删除
关闭
关闭