自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(26)
  • 资源 (1)
  • 收藏
  • 关注

原创 让数据用起来:数据中台建设的评估与选择(第4章)

To be continued…

2024-02-26 11:03:59 419

原创 让数据用起来:数据中台建设与架构(第3章)

数据中台的使命:把“数据资产”作为一个基础要素独立出来,让成为资产的数据作为**生产资料**融入业务价值创造过程,持续产生价值。

2024-02-26 11:00:02 858

原创 fatal error in launcher to create process using d:/python.exe c:/pip.exe

fatal error in launcher to create process using d:/python.exe c:/pip.exe

2024-02-01 15:53:27 164

原创 centos 7 restart network failed,虚拟机ping不通外网

xshell远程连接虚拟机hadoop103突然失败

2023-12-27 01:29:27 144

原创 中台产品经理宝典:中台建设全过程方案(第五篇)

本书的精髓,从0到1建设业务中台。

2023-12-01 11:01:47 303

原创 中台产品经理宝典:业务标准化与能力抽象(第四篇)

业务标准化与能力抽象。

2023-12-01 10:50:05 191

原创 中台产品经理宝典:中台体系设计概览(第三篇)

中台全局建设路径概览和准备。

2023-12-01 10:46:47 54

原创 中台产品经理宝典:中台到底是什么(第二篇)

中台到底是什么?

2023-11-28 16:39:17 149

原创 中台产品经理宝典:中台战略的前世今生(第一篇)

中台战略的前世今生。

2023-11-28 16:37:44 65

原创 【读书笔记】阿里巴巴大数据实践:数据应用(第16章)

本章将介绍数据处理的最终目的——数据应用,将数据服务作为“产品”向企业内、外部提供也不过是近10年的事情,个人认为国内在这方面还有很长的路要走。

2023-11-15 09:44:31 37

原创 【读书笔记】阿里巴巴大数据实践:数据质量(第15章)

数据质量是使用数据的基础和前提,继承数据产品的资产等级来安排数据质量保障的优先顺序,使用质量配套工具在数据加工的各个环节进行质量卡点校验,最后通过起夜率、质量事件、质量故障等指标来量化数据质量。

2023-11-15 09:34:09 83

原创 【读书笔记】阿里巴巴大数据实践:存储和成本管理(第14章)

一句话评论:数据每时每刻都在增长,存储能力跟不上数据的增长速度,这就需要不断优化存储方法、制定合理的存储策略,保障重要数据安全并控制存储成本在预算范围之内。

2023-11-13 15:14:00 65

原创 【读书笔记】阿里巴巴大数据实践:元数据(第12章)

随着集团业务的快速发展,数据库表的数量不断增加,任何人都无法宣告绝对地了解所有数据。为这些纷繁复杂、交错纵横的数据库表给构建一份数据地图,梳理各个业务域的数据血缘,向数据研发和使用人员提供使用指南,提高数据链路的整体效率、创造业务价值。

2023-11-13 15:02:33 269

原创 【读书笔记】阿里巴巴大数据实践:事实表设计(第11章)

“事实” 是数仓建模的核心,几乎所有数仓动作的最终目的就是从不同维度、角度对“事实”进行计算,以此进行数据监控、洞察和预测,本章将讲述事实表理论基础和阿里巴巴的设计实践。

2023-11-11 15:34:23 46

原创 【读书笔记】阿里巴巴大数据实践:维度设计(第10章)

维度设计的理论基础与阿里巴巴的维度设计实践。

2023-11-10 19:13:29 232

原创 【读书笔记】阿里巴巴大数据实践:阿里巴巴数据整合及管理体系(第9章)

用一套话语体系规范定义所有指标——OneData 体系。

2023-11-10 18:53:30 84

原创 【读书笔记】阿里巴巴大数据实践:大数据领域建模综述(第8章)

历经三个阶段,阿里巴巴以维度建模为核心方法论,拥抱Hadoop等分布式平台,构建起统一化的集团数据整合及管理方法体系——OneDATA。

2023-10-31 16:48:12 36

原创 【读书笔记】阿里巴巴大数据实践:数据挖掘(第7章)

在常见的数据服务之外,还可以使用各种机器学习算法深度挖掘巨量数据中蕴含的价值,基于并行计算框架的算法平台(基础设施)和算法资产管理体系缺一不可。

2023-10-30 16:54:37 89

原创 【读书笔记】阿里巴巴大数据实践:数据服务(第6章)

业务的大发展要求不断丰富数据服务方式;另一方面,数据一致性又要求整合这些服务方式,因此基于统一的数据服务层,利用数据服务平台提供包括定制/拉取/实时推送在内的多种数据服务方式。这就是OneService的诞生。

2023-10-26 15:32:51 81

原创 【读书笔记】阿里巴巴大数据实践:离线数据开发(第4章)

阿里巴巴的数据计算层包括,数据存储即计算平台(离线计算平台MaxCompute 和实时计算平台 StreamCompute),以及数据整合及管理体系(OneData)。

2023-10-16 19:19:45 39

原创 【读书笔记】阿里巴巴大数据实践:数据同步(第3章)

来自不同业务系统的交易数据是除了日志外另一个最重要的数据来源,如何将这部分数据高效、及时、准确的同步至数据仓库是任何一个大数据系统都不可避免要面临和解决的问题。

2023-10-13 20:13:01 81

原创 【读书笔记】阿里巴巴大数据实践:日志采集(第2章)

日志是重要的数据来源之一,对日志的收集、处理、集成的数据开发工作,尤其是多个渠道(网页端、APP端、小程序端、公众号端等)的数据整合是较大的难点,对后续的业务分析至关重要。

2023-10-12 16:48:15 65

原创 【读书笔记】阿里巴巴大数据实践:大数据系统体系架构图

IT 时代 --> DT时代的必经之路。

2023-10-10 13:26:44 261

原创 Stata之数据录入

Stata之数据录入1.直接输入数据1.1交互方式输入数据 edit1.2程序方式录入数据 input--end2.导入已有的数据或文本2.1导入dta文件2.2导入文本文件2.3导入Excel文件在Stata中,录入数据的方法无非是直接输入数据或者导入已有的数据集。1.直接输入数据1.1交互方式输入数据 edit在命令窗口输入edit,在打开的数据编辑器中直接输入或粘贴数据。需要注意的是,某列变量的数据类型按照此列输入的第一个数据的类型来确定。1.2程序方式录入数据 input–end在dof

2020-07-25 18:10:58 8687

原创 ‘str‘ object has no attibute ‘text‘

爬虫时出现'str' object has no attibute 'text'  在用python爬英为财情的股票数据时出现上述报错,事故现场如下: ret = requests.get(url=info0_url,headers=headers,data=data,timeout=10) html = ret.content.decode("utf-8") html_list = html.text.split('\n') return html_list报错信息

2020-07-23 11:00:41 5280 2

原创 为什么不用Word,非要用Markdown?

为什么不用Word,非要用Markdown?究竟什么是Md?Md的本质是什么Md与Word的区别常用的Md功能  CSDN官方帮助文档手把手教你怎么使用Md,还需要我再写一遍吗?官方文档太长啦,很多我们这种只做网络爬虫来支撑学术研究的金融狗根本用不上,下面我就边学边记录Md的常用功能。究竟什么是Md?  师兄向我们介绍Md时,我是蒙的,啥?Md?是什么缩写吗?为什么有MSoffice不用,非要用这种让计算机小白摸不着头脑的东西来写推文?是Word它不香吗?直接用鼠标完成各种文本操作不美吗?  很好,

2020-07-23 10:43:05 716

A股纳税人识别号.xlsx

股票代码,证券简称,识别号,证券全称

2021-03-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除