Coder李海波
码龄19年
  • 1,189,805
    被访问
  • 125
    原创
  • 1,162,126
    排名
  • 444
    粉丝
关注
提问 私信
  • 加入CSDN时间: 2003-01-23
博客简介:

架构和代码

博客描述:
内容比较杂
查看详细资料
个人成就
  • 获得71次点赞
  • 内容获得260次评论
  • 获得170次收藏
创作历程
  • 2篇
    2021年
  • 4篇
    2020年
  • 1篇
    2019年
  • 1篇
    2018年
  • 3篇
    2016年
  • 1篇
    2015年
  • 6篇
    2014年
  • 1篇
    2012年
  • 13篇
    2011年
  • 33篇
    2010年
  • 34篇
    2009年
  • 23篇
    2008年
  • 9篇
    2007年
  • 6篇
    2006年
  • 1篇
    2004年
成就勋章
TA的专栏
  • 1.Linux/C/Python
    48篇
  • 2.软件设计/架构/测试
    25篇
  • 3.大数据技术
    6篇
  • 4.自然语言处理/机器学习
    14篇
  • 5.产品研究/点评/创意
    10篇
  • 6.软件工程/管理
    19篇
  • 7.杂七杂八
    11篇
兴趣领域 设置
  • 大数据
    spark
  • 最近
  • 文章
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Apache Doris和ClickHouse的深度分析

2021-10-13背景介绍Apache Doris是由百度贡献的开源MPP分析型数据库产品,亚秒级查询响应时间,支持实时数据分析;分布式架构简洁,易于运维,可以支持10PB以上的超大数据集;可以满足多种数据分析需求,例如固定历史报表,实时数据分析,交互式数据分析和探索式数据分析等。ClickHouse是俄罗斯的搜索公司Yadex开源的MPP架构的分析引擎,号称比事务数据库块100-1000倍,团队有计算机体系结构的大牛,最大的特色是高性能的向量化执行引擎,而且功能丰富、可靠性高。京
转载
发布博客 2021.10.20 ·
2289 阅读 ·
2 点赞 ·
0 评论

京东OLAP亿级查询高可用实践(转)

​​​​​​https://wemp.app/posts/4a0cffbf-63e7-4592-8efa-6e47f8f58d32OLAP(On-Line Analytical Processing)是联机分析处理,它主要用于支持企业决策和经营管理,是许多报表、商业智能和分析系统的底层支撑组件,支持从海量数据中快速获取数据指标。京东OLAP的发展历经Druid、Kylin、Doris和ClickHouse,广泛服务于京东各个子集团和各类场景中,经历了数次大促的考验无事故,本文会重点以ClickHou
转载
发布博客 2021.10.09 ·
91 阅读 ·
0 点赞 ·
0 评论

TPC-DS用于Clickhouse和Doris性能测试

大致介绍TPC-DS采用星型、雪花型等多维数据模式。它包含7张事实表,17张纬度表平均每张表含有18列。其工作负载包含99个SQL查询,覆盖SQL99和2003的核心部分以及OLAP。这个测试集包含对大数据集的统计、报表生成、联机查询、数据挖掘等复杂应用,测试用的数据和值是有倾斜的,与真实数据一致。可以说TPC-DS是与真实场景非常接近的一个测试集,也是难度较大的一个测试集。Clickhous...
原创
发布博客 2020.05.07 ·
5715 阅读 ·
3 点赞 ·
4 评论

Clickhouse在Docker中的编译、安装和集群部署

Clickhouse是俄罗斯Yandex公司开源的OLAP系统,单表性能最好,最近两年发展很快。百度开源的Doris是另外一个,我上次记录了百度开源OLAP系统Apache Doris在Centos7.0下编译和安装。Clickhouse官网Clickhouse GitHub地址Doris官网Doris GitHub地址这两个系统因为源码编译和安装比较麻烦,估计很多人会卡在这一步,不利...
原创
发布博客 2020.04.29 ·
1480 阅读 ·
1 点赞 ·
0 评论

百度开源OLAP系统Apache Doris在Centos7.0下编译和安装

Doris是百度2017年开源的OLAP系统,能够支撑10P级的数据规模,每天几百亿条写入量,秒级百亿条查询,在数据查询、报表BI、用户行为分析系统,甚至交互式分析中广泛应用。 官方文档:http://doris.apache.org/ github地址:https://github.com/apache/incubator-doris 但是因为系统很庞大,结...
原创
发布博客 2020.03.29 ·
3235 阅读 ·
1 点赞 ·
0 评论

std map erase的问题记录

网上各种erase的版本不可信,还是自己试验了一下。erase删除迭代器或者Key后,指针会指向下一个迭代器,如果此时再it++,就多移动了一次。http://www.cplusplus.com/reference/map/map/erase/The other versions return an iterator to the element that follows the la...
原创
发布博客 2020.01.08 ·
190 阅读 ·
0 点赞 ·
0 评论

CryptoKittes(加密猫,谜恋猫)智能合约结构和源码解析

  CryptoKittes(加密猫、谜恋猫,https://www.cryptokitties.co/)是运行在以太坊上的一个游戏。 谜恋猫是世界首款架构在区块链技术上的数字猫收集与繁殖游戏,同样的技术突破使得比特币和以太坊的运作的基础。  具体可以参考如下两篇参考资料:【CryptoKitties源码解析】养猫的正确姿势!教程 | 如何在Ethereum上编写自己的CryptoKitties风...
原创
发布博客 2018.03.06 ·
7548 阅读 ·
6 点赞 ·
0 评论

一个最简单的内存池AutoMemory

C/C++中内存管理是个最麻烦的事情,内存申请释放,内存泄露,内存越界,甚至是内存碎片,就会导致程序出Core或者变慢。如何有效的管理内存,有很多方法,我认为最简单的方式是用一个内存池来管理内存。    谈到内存池的时候,就有必要说下程序的生命周期和作用域,数据分为三类:1类是进程数据(全局数据)。2、线程数据,每一个线程一份。3、请求数据,每一次调用一份。            如果
原创
发布博客 2016.08.18 ·
1216 阅读 ·
1 点赞 ·
0 评论

MFC中如何利用ffmpeg和SDL2.0多线程多窗口播放摄像头的视频

我前一篇文章,《Window下用DirectShow查找摄像头(含分辨率)和麦克风》,详细介绍了如何查找摄像头和摄像头支持的分辨率信息,查找到摄像头和麦克风之后做什么呢?两个目的,第一个目的是播放,第二个目的是编码之后发送服务器流媒体数据,第三个目的就是存在本地硬盘上了,本文就是播放摄像头采集的数据。 本人初次接触音视频相关的项目,研究了几天,从网上断断续续的找到不少摄像头播放的...
原创
发布博客 2016.08.07 ·
6001 阅读 ·
3 点赞 ·
6 评论

Windows下用DirectShow查找摄像头(含分辨率)和麦克风

在视频聊天、视频会议、在线监控和视频展台等项目中,需要查找出本地电脑上连接的所有摄像头,网上流传比较多的方式是ffmpeg的方式,这种方式可以跨平台,不同的平台下调用不同的库。这种方式在控制台直接打印了摄像头的信息,无法(或者说我暂时没找到)在内存中获取,因此直接采用了DirectShow的方式,DirectShow枚举IMoniker和Ipin。因为网上的文档,不是特别详尽,所以...
原创
发布博客 2016.08.07 ·
6314 阅读 ·
1 点赞 ·
4 评论

Python发送邮件的例子

import base64, smtplibfrom email.mime.text import MIMETextfrom email.header import Headerdef mail_info(data, date): mailserver = "smtp.exmail.qq.com" username = "server@xxx.com" passwo
原创
发布博客 2015.10.20 ·
1539 阅读 ·
0 点赞 ·
0 评论

2014新手学Android(1)- Android开发环境安装和支持库安装

纯粹是个人兴趣,想学习一下Android的开发。哥之前可是有5年Windows .Net的开发经验,Asp.net和Windows Form玩得很熟。没想到,一接触Android就傻眼了,完全不一样啊,哥不理解啊。Android的发展非常快,如果是11、12、13年的Android技术文章,千万别看,否则会走很多弯路,说多了都是泪啊。一、安装 遇到第一个问题,就是怎么安装An...
原创
发布博客 2014.11.11 ·
3521 阅读 ·
1 点赞 ·
0 评论

数据挖掘十大经典算法

一、C4.5     C4.5,是机器学习算法中的一个分类决策树算法,它是决策树(决策树也就是做决策的节点间的组织方式像一棵树,其实是一个倒树)核心算法ID3的改进算法,所以基本上了解了一半决策树构造方法就能构造它。决策树构造方法其实就是每次选择一个好的特征以及分裂点作为当前节点的分类条件。二、The k-means algorithm即K-Means算法    k-means
转载
发布博客 2014.09.23 ·
2188 阅读 ·
0 点赞 ·
0 评论

性能测试、指标和优化 -- 性能相关总结

这篇博文主要是涉及到服务端性能,对于前端性能比较少涉及,但是最后一部分简单介绍了前端(Web页面)的测试和调优。这篇文章最早写于2012年,今天翻出来,又重新梳理了一下。哦,对了,如果对本博客中所有文章有疑问,请发邮件到lihaibo2006$gmail.com,我一般晚上就能看到。
原创
发布博客 2014.09.17 ·
5049 阅读 ·
0 点赞 ·
0 评论

App开发者如何选择移动广告平台3 - 广告平台的选择标准

App开发者公司,一般是没有能力接品牌的,有能力接品牌的,也会面临两个较大的问题:商业团队、广告填充率、回款周期等一系列的问题。无线商业这块刚开始起步,大多数是没有从业经验的,无论商业产品、设计、运营、销售的人才都不好招聘。除非非常有实力的App,才有可能自己去自己搞一套商业系统。所以,一般App都会选择一个App广告平台,现在国内的移动广告平台公司太多了,知名的全国性的大概有20家以上,不知名地方性的不知道有多少了。怎么选择呢?有如下几个标准。
原创
发布博客 2014.06.02 ·
3526 阅读 ·
0 点赞 ·
1 评论

App开发者如何选择移动广告平台2 - 移动变现模式分析

上面分析了开发者群体,可能并不能涵盖全面,但是每个开发者需要根据自身的特点来选择变现的模式。下面就App的变现模式做一个全面的分析。 游戏、广告、电商是互联网的三种变现模式,移植到移动互联网也同样适用。
原创
发布博客 2014.06.02 ·
4681 阅读 ·
0 点赞 ·
0 评论

App开发者如何选择移动广告平台1 - 开发者规模分析

国内Apps开发者群体,分为几类:“富二代”、“郭美美”、“中产阶级”、“屌丝”,不同的群体选择广告平台的依据并不一样。
原创
发布博客 2014.06.02 ·
2354 阅读 ·
0 点赞 ·
0 评论

python获取gbk中文字符

# -*- coding: gbk -*-def getGBK(s): i = 0 first = (int('81',16),int('FE',16)) second1 = (int('40',16),int('7E',16)) second2= (int('80',16),int('FE',16)) buf = [] whil
原创
发布博客 2012.03.14 ·
5171 阅读 ·
0 点赞 ·
0 评论

用Hyperspace Analogue to Language (HAL)进行短文本扩展

HAL是什么我就不解释了,具体可以参考:http://www.zhan5zhan.com/post/6.html1、何谓短文本  论坛、博客、微博、聊天记录、问答,都可以认为是短文本。虽然博客、论坛也有很多长文本,但是是少数。2、短文本难点  1)不规范、口语化。
原创
发布博客 2011.09.14 ·
4600 阅读 ·
0 点赞 ·
0 评论

信息检索(IR)的评价指标介绍 - 准确率、召回率、F1、mAP、ROC、AUC

在信息检索、分类体系中,有一系列的指标,搞清楚这些指标对于评价检索和分类性能非常重要,因此最近根据网友的博客做了一个汇总。准确率、召回率、F1信息检索、分类、识别、翻译等领域两个最基本指标是召回率(Recall Rate)和准确率(Precision Rate),召回率也叫查全率,准确率也叫查准率,概念公式:             召回率(Recall)      =  系统检索到的相关文件 /
原创
发布博客 2011.07.06 ·
55082 阅读 ·
18 点赞 ·
15 评论
加载更多