自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (1)
  • 收藏
  • 关注

原创 Presto简介

PrestoPresto是基于大数据的分布式SQL查询引擎Presto是开源的、基于大数据的交互式查询引擎。它设计的目的就是用来提高海量数据查询的速度。Presto是运行在集群中的一个分布式系统,它可以分析海量数据。使用Presto,可以通过SQL接入和查询不同源头的数据。Presto的整体架构包含一个coordinator和多个workers。通过客户端提交query给coordinator(比如Presto CLI)。coordinator负责解析分析成执行计划,然后将这些可执行计划部署到wo

2020-12-05 21:52:57 336

原创 BitMap原理

BitMap传统BitMap传统的bitmap是用一个二进制位(bit)来表示一个值,0表示不存在,1表示存在,这样存储所有32位长度的数据只需要512M存储空间。但是有个问题:这种bitmap比较固定,即使只表示个位数个数字也需要512M的空间,大部分位都是0,比较浪费空间。Roaring BitMaps未完待续~...

2020-11-17 19:13:12 727

原创 《小强升职记(升级版)》读书笔记

小强升职记最近看了一本职场相关的书,内容通俗易懂,书中介绍的方法对解决职场一些问题有一定的帮助,比如工作中我们为什么一直忙但是没有成果、无法平衡工作和生活等第一章:你的时间都去哪了通过记录发现时间都花在哪些地方工作四步:将所有任务都放在工作篮中,合理安排,在自己最高效的时候做重要的事。找到自己的价值观第二章:无压工作术四象限法(这个大家都已经很熟悉了)。首先通过上一章介绍的价值观判断任务的轻重缓急,然后第一象限工作无法避免,尽量减少;第三象限工作尽量交给别人做;第四象限事情尽量杜绝;所以

2020-10-12 13:07:47 233

原创 《架构整洁之道》整理

软件架构的终极目标:用最小的人力成本来满足构建和维护该系统的需求。系统的两个价值维度:行为价值架构价值编程范式结构话编程面向对象编程函数式编程SOLID设计原则:SRP:单一职责原则。每个软件模块有且只有一个需要被改变的理由。OCP:开闭原则。如果软件系统想要更容易被改变,那么其设计就必须允许新增代码来修改系统行为,而不是只能靠修改原来的代码。LSP:里式替换原则。如果想要用可替换的组件来构建软件系统,那么这些组件就必须遵守同一个约定,一遍让这些组件可以互相替换。IS.

2020-09-20 20:01:25 152

原创 《深入浅出数据分析》内容摘要

数据分析引言数据分析就是仔细推敲证据基本流程:确定:确定问题,了解问题。分解:分解问题和数据,使其成为更小的组成部分。评估:对前两步了解到到的情况作出各种结论。决策:把结论组合在一起得出决策。明确心智模型:根据已有数据明确你知道的和不知道的。从一开始就务必要基于正确的假设建立模型,并且要做好准备,一旦所得到的的数据有违你的假设,就要立即回头重新详加思考。实验想要找到销量下滑的原因,需要将数据进行细分,排除影响因素。比如不同区域的咖啡销量数据放在一起看,不容看到销

2020-09-12 23:08:16 290

原创 广告考核指标汇总

目录基础指标CPM(Cost Per Mille或Cost Per Thousand Impressions)CTR(Click Through Rate)CPC(Cost Per Click或Cost Per Click-Through)效果指标CPA(Cost Per Action)CPL(Cost Per Lead)CVR(Click Value Rate)ROI(Return On Investment)留存用户数DAU(Daily Active User)WAU(Weekly Active Use

2020-08-22 21:10:25 905

原创 Elasticsearch原理(上)

Elasticsearch原理ES是啥:Elasticsearch是一个开源的高扩展的分布式全文检索引擎,它可以近乎实时的存储、检索数据;ES应用场景:站内搜索日志解析:日志,事物数据,分析和挖掘,趋势,统计,摘要和异常价格提醒商业统计:快速调查,分析,可视化,从一堆数据中获取问题答案倒排索引:倒排索引:一种索引方法,被用来存储在全文搜索下某个单词在一个...

2020-04-26 21:51:19 180

原创 快速排序-python

快速排序# coding=utf-8def partiton(alist, start, end): base = alist[start] left = start right = end while left < right: while alist[right] >= base and left < right: ...

2020-04-25 22:12:39 113

原创 归并排序-python

归并排序# coding=utf-8def merge(a_list, b_list): # 合并两个子序列 a_len = len(a_list) b_len = len(b_list) a_index = b_index = 0 tmp_list = list() while a_index < a_len and b_index &...

2020-04-25 21:59:34 487

原创 替换空格-剑指Offer

替换空格题目描述请实现一个函数,将一个字符串中的空格替换成“%20”。例如,当字符串为We Are Happy.则经过替换之后的字符串为We%20Are%20Happy。思路遍历一遍,统计空格数量,扩大相应容量两个指针,一个指向旧的长度,一个新的长度,从后往前走,一个一个走,遇到空格,right走3个,left走1个left == right或left == 0就不用接着走了代码public

2016-06-20 21:40:39 221

原创 CentOS下配置ssh免密码登录

有时候当你的网络环境发生了变化,你的虚拟机的网络配置也做了相应的改变,然后发现ssh登录访问不了别的机子了,这时候就需要对ssh也修改一下配置。

2015-11-02 21:49:29 344

Fatjar 0.0.32 for eclipse 4.4

fatjar是eclipse中一个很好用的打包插件,但是0.0.31版本不能安装在eclipse4.4之后的版本中,需要0.0.32版本才能成功安装。下载压缩包之后,解压到eclipse目录下的plugins目录中,然后重启eclipse即可识别,此时,选中你要打包的工程,右键即可找到“Build Fat Jar”选项,如果找不到,可以到“Export”->“Others”中找。

2016-02-28

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除