- 博客(8)
- 资源 (6)
- 收藏
- 关注
原创 网站百度统计referrer被禁用解决方案
客户端请求首先通过 Nginx,Nginx 负责反向代理和负载均衡,然后将请求传递给 Gunicorn,Gunicorn 处理 Django 应用的业务逻辑。检查你的网站 HTTPS 配置,确保证书有效且配置正确。偶然发现百度统计测试http首页时,显示代码安装成功,但是https就提示referrer被禁用。生产环境使用了Nginx作为反向代理服务器和静态文件服务器,Gunicorn作为WSGI服务器,提供并发处理和进程管理能力。但是,当我想看一下百度统计数据时,发现一片空白。
2024-01-05 17:30:28 1237
原创 NameABC - 变量英文命名神器
面向数据工程师、数据分析师等数据领域从业者,提供将逻辑模型中的属性、标签和指标等中文命名转化为简洁的英文命名的服务。
2023-12-11 16:01:39 419
原创 DataHub:通用元数据搜索和发现工具
作为全球最大的专业社交网络和经济图表的运营商,LinkedIn的数据团队不断努力扩展其基础设施,以满足不断增长的大数据生态系统的需求。随着数据量和丰富度的增加,数据科学家和工程师要发现可用的数据资产、了解它们的来源以及根据洞察采取适当的行动变得越来越具有挑战性。为了帮助我们在数据的不断增长中继续扩展生产力和创新,我们创建了一款通用的元数据搜索和发现工具DataHub。
2023-09-20 13:30:00 611
原创 DataHub:流行的元数据架构解释
十年前,当我在 LinkedIn 开始我的旅程时,该公司刚刚开始经历数据量、种类和速度的极端增长。在接下来的几年里,我和 LinkedIn 数据基础设施团队的同事们构建了如 Espresso、Databus 和 Kafka 等基础技术,以确保 LinkedIn 在下一波增长中生存和繁荣。几年后,我成为当时规模相当小的“数据分析基础设施”团队的技术负责人,该团队运行并支持 LinkedIn 的 Hadoop 使用,还维护了一个横跨 Hadoop 和 Teradata 的混合数据仓库。
2023-09-19 14:00:00 444
原创 使用DataHub,个人身份信息(PII)分类变得更加简单
管理敏感数据是现代数据治理的核心。无论您是在应对GDPR和CCPA的复杂问题,还是需要负责任地向他人授权数据访问,制定一个关于标记敏感数据的策略是至关重要的。DataHub流行的业务词汇表是一种强大的方法,可以对PII(个人身份信息)和合规类型进行建模,并对数据堆栈中的数据实体进行分类。除了手动分配这些分类外,DataHub现在可以在摄取阶段自动对敏感数据或PII进行分类和标记,使数据发现和访问变得简单、可扩展和安全。
2023-09-18 14:34:07 376
原创 元数据管理的三个必备要素(二)
我回来了,这次要讲关于元数据必备的另一篇文章。上次,我谈到了“元数据360”以及它如何结合逻辑元数据和技术元数据来有效管理和使用元数据。今天,我要专注于我个人非常热衷的元数据管理原则:Shift Left(左移)。从原则上讲,Shift Left指的是在数据生成源头即数据产生的地方声明和发出元数据的做法。这意味着,我们不是将元数据视为事后工作(这往往是情况),然后稍后再注释它,而是在代码的管理和维护地点立即发出元数据。
2023-09-15 10:40:07 70
原创 元数据管理的三个必备要素(一)
经过一番深刻的反思,我开始将我在DataHub社区中的工作视为弥补我在过去数据领域工作中所犯过的错误的方式。让我来解释一下。在我早期从事数据分析和BI/分析工程领域的日子里,我也曾犯下一些错误,这些错误让数据管理变得更加困难。我通过构建临时资源来回答干系人提出的具体问题,而没有花时间系统地了解需要回答的各种问题,并构建设计良好、文档完备、可重复使用的组件,迅速为我的团队积累了技术债务。
2023-09-14 09:51:58 97
原创 独一无二的开源元数据平台:DataHub
DataHub 是一个可扩展的元数据平台,可实现数据发现、数据可观测性和联合治理,以帮助管理您的数据生态系统的复杂性。DataHub是一个现代化的数据目录,旨在实现端到端的数据发现、数据可观察性和数据治理。这个可扩展的元数据平台既可以帮助开发人员应对不断演变的数据生态系统的复杂性,也可以帮助其他数据从业者充分利用组织中数据的全部价值。
2023-09-12 20:03:25 1729 2
ping多主机工具fping4.0
2018-09-26
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人