![](https://img-blog.csdnimg.cn/cadaf489a2874e39abcf035875562b44.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
数据分析
文章平均质量分 91
数据分析、数据管理、数据库相关的信息
高阳很捷迅
这个作者很懒,什么都没留下…
展开
-
实时数仓-Flink使用总结
阿里云实时计算Flink版是阿里云基于Apache Flink构建的企业级、高性能实时大数据处理系统。具备一站式开发运维管理平台,支持作业开发、数据调试、运行与监控、自动调优、智能诊断等全生命周期能力。本期将对Flink的使用进行总结。原创 2023-11-13 15:08:30 · 1001 阅读 · 1 评论 -
实时数仓-hologres使用总结
本期是从Hologres开发、数据同步实战、性能调优、运维等方面对hologres使用进行的全面总结。原创 2023-11-02 16:37:38 · 3558 阅读 · 0 评论 -
实时数仓-Hologres介绍与架构
本文是向大家介绍Hologres是一款实时HSAP产品,隶属阿里自研大数据品牌MaxCompute,兼容 PostgreSQL 生态、支持MaxCompute数据直接查询,支持实时写入实时查询,实时离线联邦分析,低成本、高时效、快速构筑企业实时数据仓库(Real-Time Data Warehouse)。原创 2023-10-26 10:40:21 · 2403 阅读 · 0 评论 -
JS小数运算精度丢失的问题
工作中会不会经常会碰到一些数据指标的计算,比如百分比转化,保留几位小数等,就会出现计算不准确,数据精度丢失的情况。通过这篇分享借助第三方库能够轻松解决数据精度丢失的问题。原创 2023-10-25 11:10:33 · 269 阅读 · 0 评论 -
“30分钟”带你走进线性回归的世界,轻松学习互联网营销推荐算法!
本章主要介绍用于推荐系统的算法-线性回归算法的推导介绍,文章思路如下:由机器学习介绍,到监督学习,并重点介绍监督学习中回归问题里面的线性回归问题及推导。原创 2023-05-31 18:26:22 · 258 阅读 · 0 评论 -
DataX-一款稳定高效的数据同步工具-从安装、启动、配置、使用总结,看这篇让你一步到位
DataX是阿里巴巴使用 Java 和 Python 开发的一个异构数据源离线同步工具;致力于实现包括关系型数据库MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、MaxCompute、DRDS等各种异结构数据源之间稳定高效的数据同步功能。Datax-web基于datax,增加了web界面,把Datax基于命令行任务通过java代码串联了起来,并提供了可视化的任务管理。原创 2023-05-25 16:17:50 · 2584 阅读 · 2 评论 -
互联网营销推荐算法理论-30分钟理解协同过滤
不论在淘宝还是京东,你浏览了/购买了某个商品A,后面几天你在该app内总是会在首页看到商品A和商品A相似的商品,背后支撑这种能力的就是推荐系统,而其推荐算法可能就是协同过滤。原创 2023-05-25 15:50:12 · 314 阅读 · 0 评论 -
OCPC系列三 - 展开说说广告业务及算法介绍
算法角度解决ocpc问题:一是要给出ctr, cvr的预估模型,二是要保证cpa的误差率.原创 2023-05-15 14:08:00 · 455 阅读 · 0 评论 -
人人都是数据分析师-数据分析之数据图表可视化(下)
本篇将重点介绍序列类和描述类图表以及表格类数据呈现原创 2023-04-09 21:09:28 · 462 阅读 · 0 评论 -
人人都是数据分析师-数据分析之数据图表可视化(上)
BI报表、运营同学的汇报报告中数据图表大多为 表格、折线图、柱状图和饼图,但是实际上还有很多具有代表性的可视化图表,因此将对常见的可视化图表进行介绍,希望这些图表可视化方法能够更好的提供数据的可用性。原创 2023-04-09 21:00:36 · 859 阅读 · 0 评论 -
数据同步-数据库间的双向同步
当业务侧需要MongoDB降配、活动数据迁移时都需要应用切换数据库实例进行发版,发版过程中需最大程度保证新旧数据库数据一致,这就涉及到了一种同步技术-数据双向同步。在同步过程中遇到了一些可能会产生问题或引发思考的点,希望利用这篇文档进行归纳总结。原创 2023-03-15 09:39:30 · 1094 阅读 · 0 评论 -
不可错过的SQL优化干货分享-sql优化、索引使用
本文是向大家介绍在sql调优的几个操作步骤,它能够在日常遇到慢sql时有分析优化思路,能够让开发者更好的了解sql执行的顺序和原理。原创 2023-02-15 17:23:10 · 292 阅读 · 0 评论 -
ClickHouse表引擎详解看这篇就够了-基本讲解、处理逻辑、测试实例
表引擎在 ClickHouse 中的作用十分关键,直接决定了数据如何存储和读取、是否支持并发读写、是否支持 index、支持的 query 种类、是否支持主备复制等。ClickHouse表引擎一共分为四个系列,分别是Log、MergeTree、Integration、Special。其中包含了两种特殊的表引擎Replicated、Distributed,功能上与其他表引擎正交,根据场景组合使用。原创 2023-01-03 17:27:55 · 2075 阅读 · 0 评论 -
MYSQL 数据库企业级架构演变史
从初级架构到中级架构原来有这么多次的升级,并且每一次的进阶都有其优缺点。原创 2022-11-25 18:22:45 · 407 阅读 · 0 评论 -
深入理解MySQL执行过程及执行顺序
MySQL在我们的开发中基本每天都要面对的,作为开发中的数据的来源,MySQL承担着存储数据和读写数据的职责。因此学习和了解MySQL是至关重要的,那么当我们在客户端发起一个SQL到出现详细的查询数据,这其中究竟经历了什么样的过程?MySQL服务端是如何处理请求的,又是如何执行SQL语句的?转载 2022-11-09 13:52:02 · 160 阅读 · 0 评论 -
MySQL DBA 防坑指南 看这篇就够了
本文主要是介绍MySQL DBA常见问题和解决思路。原创 2022-10-21 11:49:49 · 243 阅读 · 0 评论 -
数据仓库-IP段关联计算优化-从优化原理到优化手段一一道来
营销活动指标体系通过IP段获取到用户的所属地域进行分析,但IP段与其它字段的映射方式不同,IP段是一个范围,不是一对一关系,关联时会发生笛卡尔积,主要表现为耗时很高(1万左右的数据量耗时一小时以上),严重影响指标的及时性,所以要进行优化,来解决任务耗时高的问题。原创 2022-10-13 17:33:16 · 1120 阅读 · 0 评论 -
一款OLAP数据库ClickHouse
基于3W1H原则,讲解ClickHouse,以便于后续开发实践。原创 2022-10-13 17:36:06 · 1491 阅读 · 0 评论 -
互联网营销之用户标识
作为在互联网营销领域中拼搏的我们,宏观了解互联网营销整体的背景有助于我们更好的理解自己的工作以及对应需求的意义。原创 2022-09-08 17:51:35 · 471 阅读 · 0 评论 -
高并发下,如何保证分布式唯一全局 ID 生成?
系统唯一ID是我们在设计一个系统的时候常常会遇见的问题,也常常为这个问题而纠结。这篇文章就是给各位看官提供一个生成分布式唯一全局id生成方案的思路,希望能帮助到大家。转载 2022-09-01 17:20:07 · 204 阅读 · 0 评论 -
手把手教你使用CloudCanal数据同步工具
向大家介绍的是CloudCanal 数据迁移同步工具,能够实现多种数据源之间的数据同步,并且提供可视化操作界面,帮助我们提升开发效率,让我们一起快速了解CloudCanal并掌握数据同步操作吧~原创 2022-08-18 22:11:47 · 1882 阅读 · 0 评论