GatsbyNewton
码龄12年
关注
提问 私信
  • 博客:773,020
    社区:304
    问答:1,708
    动态:15
    775,047
    总访问量
  • 114
    原创
  • 991,051
    排名
  • 2,405
    粉丝
  • 7
    铁粉
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:北京市
  • 加入CSDN时间: 2013-04-20
博客简介:

GatsbyNewton

博客描述:
天下事有难易乎?为之,则难者亦易矣;不为,则易者亦难矣。人之为学有难易乎?学之,则难者亦易矣;不学,则易者亦难矣。
查看详细资料
个人成就
  • 获得383次点赞
  • 内容获得93次评论
  • 获得974次收藏
  • 代码片获得238次分享
创作历程
  • 1篇
    2022年
  • 4篇
    2021年
  • 11篇
    2020年
  • 14篇
    2019年
  • 1篇
    2018年
  • 9篇
    2017年
  • 33篇
    2016年
  • 55篇
    2015年
成就勋章
TA的专栏
  • 分布式
    2篇
  • BigData
    2篇
  • Flink
    16篇
  • Java 并发技术
    1篇
  • Java 虚拟机
    2篇
  • 数据算法
    4篇
  • Spring Boot
    1篇
  • Spring Cloud
  • Spark
    14篇
  • HBase
    4篇
  • Hadoop
    3篇
  • Hive
    10篇
  • Kafka
    2篇
  • Machine Learning
    11篇
  • Java
    18篇
  • Scala
    14篇
  • Python
    6篇
  • MyBatis
    5篇
  • Linux
    9篇
  • MySQL
    3篇
  • C/C++
    3篇
  • Graph Computation
    8篇
  • ElasticSearch
    3篇
  • Maven/SBT
    1篇
  • Git/GitHub
  • Essay
    1篇
  • 技术杂谈
    5篇
  • Concurrency
    1篇
兴趣领域 设置
  • 数据结构与算法
    推荐算法
  • 人工智能
    tensorflowpytorchscikit-learn分类回归
创作活动更多

AI大模型如何赋能电商行业,引领变革?

如何使用AI技术实现购物推荐、会员分类、商品定价等方面的创新应用?如何运用AI技术提高电商平台的销售效率和用户体验呢?欢迎分享您的看法

186人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

Flink原理与实现:数据交换策略

数据交换策略(Data Exchange Strategy)定义了数据如何被分配到物理数据流图的 Task 中的。
原创
发布博客 2022.11.07 ·
1689 阅读 ·
0 点赞 ·
1 评论 ·
1 收藏

Streaming Systems: Watermark

Watermark
原创
发布博客 2021.10.17 ·
305 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Streaming Systems: the What, Where, When and How of Data Processing

1.
原创
发布博客 2021.08.22 ·
327 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Streaming Systems: Concept

流式数据处理在当今大数据领域是非常重要,这是有足够充分的理由的,如下:企业需要更及时地洞察他们的数据,而流式数据是实现更低延迟的一个好方法;现在商业中有海量无界的数据,使用为永不结束的数据设计的系统处理它们就更为容易;当数据一到达就进行处理,工作负载会随着时间推移更加均匀地分布,从而产生更一致和可预测的资源消耗。术语:Streaming 是什么?在讨论可能遇到的不同类型的数据时,精确的术语也是很有用的。通过两个重要且正交的维度对数据可以唯一确定——Cardinality(基数)和 Consti
原创
发布博客 2021.06.27 ·
462 阅读 ·
0 点赞 ·
1 评论 ·
0 收藏

用Gradle构建的代码在Intellij上执行出错

发布问题 2021.02.24 ·
2 回答

5 分钟学会MySQL索引【漫画版】

同学分享了一个漫画版 MySQL 索引,我觉得挺有意思的。好东西当然要和大家分享啦,下面咱们就一起开始奇趣之旅吧!扫码关注公众号:冰山烈焰的黑板报
原创
发布博客 2021.01.23 ·
596 阅读 ·
1 点赞 ·
0 评论 ·
9 收藏

数据湖

数据湖(Data Lake) 是这十年出现的一个术语,是大数据领域中数据分析流程的一个重要组成部分。它的思想是:为组织中的任何人可能需要分析的所有**原始数据(Raw Data)**提供一个存储。通常,人们使用 Hadoop 分析湖中的数据,但这个概念不仅限于 Hadoop。当我听到关于将组织要分析的所有数据集中在一起时,我立即想到的是数据仓库(Data Warehouse)和数据集市(Data Mart)(通常的区别是,数据集市用于组织中的单个部门,而数据仓库集成了所有部门。关于数据仓库应该是所有数据集
翻译
发布博客 2020.10.31 ·
363 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

Flink 调优:大规模状态数据集中的 Checkpoint 实战

Checkpoint 的配置对于 Flink 应用程序的性能和稳定性有这至关重要的影响,本文介绍大规模状态数据集中的 Checkpoint 实战。
翻译
发布博客 2020.09.06 ·
1806 阅读 ·
0 点赞 ·
1 评论 ·
4 收藏

数据算法:Bloom Filter

Bloom Filter 是一种空间高效的概率型数据结构,不需要存储元素。同时,Bloom Filter 的缺陷也比较明显,它存在假阳性错误的误判,而且一般情况下无法删除元素。
原创
发布博客 2020.08.29 ·
744 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

极简数据科学(上)

数据科学使你能够将业务问题转换为研究项目,然后再将其转换为实际的解决方案。本文回答了数据科学是什么,数据科学为什么这么重要,数据科学具有的 5 个阶段的生命周期,数据科学包含的 5 个组成部分,以及数据科学具有 6 个环节的流程。
原创
发布博客 2020.07.26 ·
358 阅读 ·
0 点赞 ·
0 评论 ·
4 收藏

动态表的持续查询

Flink 的关系 API 非常适合立即实施流分析应用程序,并且可以在多种生产环境中使用。在本文中,我们讨论了 Table API 和 SQL 的未来。
翻译
发布博客 2020.07.06 ·
547 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

一文读懂一致性哈希算法

使用一致性哈希算法时,当发生增删服务器的时候,并不能彻底杜绝数据迁移,但是却可以有效地避免全量数据迁移。同时,一致性哈希算法使用虚拟节点可以解决热点问题。
原创
发布博客 2020.06.21 ·
344 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink 调优:Checkpoint 问题排查

在使用 Flink 时, 我们基本都会用到 Checkpoint,也难免不会遇到 Checkpoint 慢或者失败等问题,本文介绍了 Checkpoint 问题排查的方法。
原创
发布博客 2020.05.24 ·
3376 阅读 ·
2 点赞 ·
0 评论 ·
12 收藏

Flink 调优:Checkpoint 配置

Checkpoint 是 Flink 的失败恢复机制,它的配置对于 Flink 应用程序的性能和稳定性有这至关重要的影响。
原创
发布博客 2020.05.04 ·
7646 阅读 ·
2 点赞 ·
2 评论 ·
15 收藏

Flink 调优:Slot and Parallelism

Flink 的并发度的设置直接影响应用程序的性能,本文介绍了应该如何设置并发度的方法。
原创
发布博客 2020.04.07 ·
1942 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏

数据算法: Bitmap

本文介绍了 Bitmap 的原理,和在大数据处理中的应用案例,如,判重、定基、排序、压缩。以及在位图图像和数码相机中的应用。最后,用位运算的方式实现了 Bitmap。
原创
发布博客 2020.03.14 ·
640 阅读 ·
0 点赞 ·
0 评论 ·
0 收藏

Flink 原理与实现:Savepoint

在 Flink 原理与实现:Checkpoint 这篇文章中,我介绍了 Flink Checkpoint。Checkpoint 是 Flink 内置的失败恢复机制。SavepointSavepoint 是 Flink 的一个非常重要的特征,被 Flink PMC 誉为“瑞士军刀(Swiss Army knife)”。Savepoint 的实现算法和 Checkpoint 一样。但是,Savep...
原创
发布博客 2020.03.01 ·
1036 阅读 ·
0 点赞 ·
0 评论 ·
1 收藏

Flink 原理与实现:Checkpoint

本文尝试用图形化语言将抽象的 Checkpoint 具象化,阐述 Naive Consistent Checkpoint、Flink Checkpoint、Failure Recovery Mechanism、以及Performance of Checkpointing。
原创
发布博客 2019.12.07 ·
1702 阅读 ·
2 点赞 ·
0 评论 ·
7 收藏

Flink 原理与实现:State

本文尝试解释 State stream processing,从 Flink 的角度,阐述 State management 和 State repartition。
原创
发布博客 2019.11.29 ·
1092 阅读 ·
0 点赞 ·
0 评论 ·
5 收藏
加载更多