laogooooog
码龄8年
关注
提问 私信
  • 博客:25,305
    25,305
    总访问量
  • 31
    原创
  • 1,970,650
    排名
  • 10
    粉丝
  • 0
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:广东省
  • 加入CSDN时间: 2017-03-10
博客简介:

laogong的博客

查看详细资料
个人成就
  • 获得8次点赞
  • 内容获得3次评论
  • 获得36次收藏
创作历程
  • 3篇
    2021年
  • 27篇
    2020年
  • 1篇
    2019年
成就勋章
TA的专栏
  • 笔记
    2篇
兴趣领域 设置
  • 大数据
    hadoophivesparketl
创作活动更多

超级创作者激励计划

万元现金补贴,高额收益分成,专属VIP内容创作者流量扶持,等你加入!

去参加
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

sql语句练习

sc分数表SId CId score01 01 80.001 02 90.001 03 99.002 01 70.002 02 60.002 03 80.0学生表student(SIdSnameSageSsex),老师表teacher(TIdTname),课程表course(CIdCnameTId)1、查询 01 课程比 02 课程成绩高的学生信息同一个表里面同一个列是无法比较的。只能将这个表jo
原创
发布博客 2021.03.28 ·
239 阅读 ·
1 点赞 ·
1 评论 ·
1 收藏

clickhouse从入门到精通

1、像MySQL一样,CH也有引擎,分为库引擎和表引擎,表引擎有memory,log,合并树等等。引擎决定数据的存储方式,是否索引,是否能分区,是否支持副本等等2、为什么快底层c++开发,可以充分利用硬件优势;历史存储;建立索引;使用大量算法处理数据;支持向量化处理...
原创
发布博客 2021.03.19 ·
525 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

大数据架构师之路

1、同时拥有实时和离线处理的架构,既保证低延迟,又保障正确性。这个方法被称作 Lambda 架构,它通过批量 MapReduce作业提供了虽有些延迟但是结果准确的计算,同时通过flink/Storm将最新数据的计算结果初步展示出来。双路生产会存在一些问题,比如加工逻辑double,开发运维也会double,资源同样会变成两个资源链路。因为存在以上问题,所以又演进了一个Kappa架构。Kappa架构从架构设计来讲比较简单,生产统一,一套逻辑同时生产离线和实时。但是在实际应用场景有比较大的局限性,在业内直接
原创
发布博客 2021.02.28 ·
1542 阅读 ·
3 点赞 ·
1 评论 ·
5 收藏

flume从入门到精通

1、Flume中提供的Channel实现主要有三个:Memory Channelevent保存在JavaHeap中。如果允许数据小量丢失,推荐使用。(宕机可能丢失数据)File Channelevent保存在本地文件中,可靠性高,但吞吐量低于Memory ChannelJDBC Channelevent保存在关系数据中,一般不推荐使用2、flume如何保证数据可靠性将channel设置为file利用事务Flume使用两个独立的事务分别负责从soucrce到channel,以及从ch
原创
发布博客 2020.11.15 ·
191 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

压缩原理

1、压缩前:谷歌大数据中心的大数据工程师处理大数据压缩后:谷歌大数据中心的<6,3>工程师处理<8,3>压缩算法里面肯定不是存的<6,3>这种字符,存的是Huffman编码,而举例+长度和literal的Huffman编码是不一样的,所以是可以区分是原意字符还是压缩标记2、每个字符可以用一个唯一的二进制串表示,这个二进制串称为这个字符的码字,这个二进制串的长度称为这个码字的码字长度3、distance码子区间的划分:存的时候只存code的Huffman编码,具体的
原创
发布博客 2020.11.14 ·
820 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java语法基础

1、计算数组的长度用length 。计算字符串的长度用length()。 字符是否相等的比较用==String[] strsstrs.lengthstrs[0].length();if (strs[i].charAt(j) != strs[i+1].charAt(j)) {return res;}
原创
发布博客 2020.08.08 ·
161 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

经典排序算法

1、归并排序归并排序算法有两个基本的操作,一个是分,也就是把原数组划分成两个子数组的过程。另一个是治,它将两个有序数组合并成一个更大的有序数组。它将数组平均分成两部分: center = (left + right)/2,当数组分得足够小时—数组中只有一个元素时,只有一个元素的数组自然而然地就可以视为是有序的,此时就可以进行合并操作了。因此,上面讲的合并两个有序的子数组,是从 只有一个元素 的两个子数组开始合并的。public class MergeSort { public static
原创
发布博客 2020.07.25 ·
144 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

数据结构

1、红黑树R-B Tree,全称是Red-Black Tree,又称为“红黑树”,它一种特殊的二叉查找树。红黑树的每个节点上都有存储位表示节点的颜色,可以是红(Red)或黑(Black)。红黑树的特性:(1)每个节点或者是黑色,或者是红色。(2)根节点是黑色。(3)每个叶子节点(NIL)是黑色。 [注意:这里叶子节点,是指为空(NIL或NULL)的叶子节点!](4)如果一个节点是红色的...
原创
发布博客 2020.05.04 ·
196 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

java入门到精通

1、CASConmpare And Swap比较和交换,主要用于多个线程对共享内存的变量(全局变量)操作时的线程安全问题。它将内存位置的内容与给定值进行比较,只有在相同的情况下,将该内存位置的内容修改为新的给定值。这是作为单个原子操作完成的。一个 CAS 涉及到以下操作我们假设内存中的原数据V,旧的预期值A(线程从共享内存中取出的数据),需要修改的新值B。比较 A 与 V 是否相等。(比...
原创
发布博客 2020.03.13 ·
324 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

mongodb入门到精通

1、mongo常用操作1)创建数据库:use mymongodb2)mongo创建集合:db.createCollection(“mycollection”)3)mongo插入数据:db.mycollection.insert({“name”:“jayo”})4)db.col.find({“name”:“ljy”, “age”:“20”}).pretty()等于MySQL的where na...
原创
发布博客 2020.02.22 ·
231 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

hbase入门到精通

1、提高Hbase API写入操作效率:Write Buffer Size Hbase Client会在数据累积到设置的阈值后才提交RegionServer。这样做的好处在于可以减少RPC连接次数Compression 压缩HColumnDescriptor hcd = new HColumnDescriptor(familyName);hcd.setCompressionType(A...
原创
发布博客 2020.02.22 ·
324 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

广告投放系统

1、广告传统广告:广告主要靠人力与众多媒体逐个谈判,或者通过广告代理购买媒体资源。不管是广告主还是媒体都要花费大量人力和时间程序化广告:广告主可以同时一投多个媒体,并且实现个性化精准营销。把广告主和媒体通过程序连接起来,省掉两边的人力安排。效率和效果都会提升2、落地页:最终生成的广告页面。因为广告框空间有限,需要落地页去展示详细的东西,并在这进行埋点3、TD:需求方可以在TD上统一管理多个...
原创
发布博客 2020.02.21 ·
2181 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

机器学习入门到精通

1、训练模型:将训练集数据,代入算法进行运算,然后不断调整参数,使运算结果和实际结果相同(近似),得到的参数代入原来的算法,得到的算法就是模型核心思想就是数学上的:根据某些数据,求得参数,得到的参数后的整个数学公式就是模型2、特征工程:特征工程就是一个把原始数据转变成特征的过程,这些特征可以很好的描述这些数据,并且利用它们建立的模型在未知数据上的表现性能可以达到最优(或者接近最佳性能)htt...
原创
发布博客 2020.02.21 ·
412 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

elasticsearch入门到精通

1、基本概念节点:node,形成集群的每台服务器。主节点:负责管理集群范围内的所有变更,例如增加、删除索引,或者增加、删除节点等。主节点并不需要涉及到文档级别的变更和搜索等操作。可以通过属性node.master进行设置。数据节点:存储数据和其对应的倒排索引。默认每一个节点都是数据节点(包括主节点),可以通过node.data属性进行设置。协调节点:如果node.master和nod...
原创
发布博客 2020.02.21 ·
356 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

spark-streaming从入门到精通

1、spark streaming获取kafka的数据有两种形式:(现在基本都是用direct方式了)receiver通过zookeeper来连接kafka队列,来获取数据。如果要做到容错,就要启用WAL机制。但吞吐量不高,效率低,而且可能反复消费direct直接连接到kafka的节点上获取数据。一般都需要自己写程序,把kafka的读偏移量写到zk中。如果spark挂掉了,会自动从...
原创
发布博客 2020.02.20 ·
325 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

个性化推荐系统

1、个性化推荐系统的推荐引擎:其实就是很简单的一个java web代码响应达到毫秒级,为什么这么快?(1)服务器分布式:请求经过8台ALB(负载均衡服务器),然后分发到48台BLU(响应服务器)进行处理(2)服务器取数是到redis取,redis是基于内存的,所以取出来很快2、个性化推荐中涉及到数据挖掘,机器学习那一块的,是指离线模型,准实时模型和在线模型:根据用户的行为特征(浏览行为和...
原创
发布博客 2020.02.20 ·
1184 阅读 ·
0 点赞 ·
0 评论 ·
2 收藏

python入门到精通

1、Python多线程import threadingimport timedef run(n): print("task", n) time.sleep(10) if __name__ == '__main__'://特别注意:不能写成threading.Thread(target=run("t1")),否则还是单线程 t1 = threading.Thre...
原创
发布博客 2020.02.18 ·
116 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

经典算法

1、给定一个只包括 ‘(’,’)’,’{’,’}’,’[’,’]’ 的字符串,判断字符串是否有效。有效字符串需满足:左括号必须用相同类型的右括号闭合。左括号必须以正确的顺序闭合。注意空字符串可被认为是有效字符串。示例 1:输入: “()”输出: true示例 2:输入: “()[]{}”输出: true示例 3:输入: “(]”输出: false示例 4:输入: “(...
原创
发布博客 2020.02.11 ·
461 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

go入门到精通

1、idea搭建go开发环境1)下载go https://dl.google.com/go/go1.12.4.windows-amd64.msi2)配置环境变量配置用户变量GOPATH,用于存放go get下载的go包: E:\code\go_pro配置系统变量GOROOT: D:\software\go配置系统变量Path: 在最后添加: ;D:\software\go\bin...
原创
发布博客 2020.02.05 ·
261 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

redis入门到精通

1、redis数据结构string类型:即简单的kvhash类型:即k field v
原创
发布博客 2020.02.03 ·
260 阅读 ·
1 点赞 ·
0 评论 ·
1 收藏
加载更多