自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 资源 (1)
  • 收藏
  • 关注

原创 你真的懂数据仓库建模吗?理论、实践一网打尽

现在行业里,谈起技术都要提下“大数据”、“云计算”等关键词,好像不提都显得技术不够档次似的。然而要“玩”好大数据,数据仓库建模尤其重要。这里从概念、必要性、理论与实践3个方面娓娓道来,和可爱的你一起“懂“点数仓建模~概念篇数据库(database)与数据仓库(data warehouse)数据库大家比较熟悉了,这里不再赘述。主要来看数据仓库。数据仓库是面向主题的(Subject-Orie...

2020-04-22 23:05:57 166 1

原创 Hbase基础知识与常见疑问

写在前面:持续更新中,大家有问题留言,一起成长吖~一、常见疑问1、为什么Hbase可以存取大数据,且存取各种快,还要使用慢的离线分析?答:因为Hbase查询模式局限,不适合复杂查询(只能按照keyrows查询),不支持join,等。但是离线数据分析多是多个表复杂的逻辑,join等。从技术上来说, HBase 更像是“Data Store(数据存储)”多于“Data Base(数据库)”,因...

2020-04-10 22:04:50 437

原创 Python生成词云图

什么是词云词云图又叫文字云,对网络文本中出现频率较高的“关键词”予以视觉上的突出,形成“关键词云层”或“关键词渲染”,从而过滤掉大量的文本信息,使浏览网页者只要一眼扫过文本就可以领略文本的主旨。由词汇组成类似云的彩色图形,是不是很酷很有趣吖~词云制作看到这么炫酷的展示效果,糟糕,是心动的感觉,想要拥有,想要自己制作。怎么破?下面我们就讲下如何制作词云图!python代码实现pytho...

2020-03-31 21:50:08 1337

原创 《网络是怎么连接的》读书笔记

我们每天都在上网,在浏览器中输入url到结果返回页面呈现,只有秒级的时间。那么问题来了,url发往何处,信息又从何处获取?了解这个我们首先要了解下网络是怎么连接的?其中HTTP协议在其中又发挥什么作用呢?网络是怎么连接的总的来言,网络连接过程主要包含下面六个步骤,我们对每个步骤进行详细分析。浏览器生成消息用户输入url时,浏览器会生成消息主要通过下面4个步骤。(1)浏览器解析urlw...

2020-03-31 21:10:20 454

原创 Python正则

Python正则正则无处不在编程中对字符串的处理无处不在,比如判断一串字符串是否符合手机号格式等,这当然可以通过逻辑编程实现,但是比较麻烦,代码复用率低;用正则可以比较简洁实现。另外,特别对于大数据的非结构化数据,比如批量日志埋点数据处理时,经常用到正则匹配进行日志清洗,所以掌握常用的正则匹配和处理规则非常重要。正则匹配规则正则匹配规则本身也是用字符串表示的,我们了解常用的字符串表示的匹...

2020-03-31 20:58:51 117

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除