- 博客(230)
- 资源 (1)
- 收藏
- 关注
原创 如何着手创建企业数据目录?(三)权限管理及版本控制
前面聊过了数据目录的设定、数据命名规则和维护规则,今天我们继续聊聊在设定中,企业的一些常见操作模式。
2024-09-21 10:00:00
2020
原创 如何着手创建企业数据目录?(二)数据的命名与维护
在前文中,我们聊到了企业着手创建数据目录时数据目录设定的一些常见模式。接下来本篇中,我们继续聊一聊关于数据目录创建时,数据的命名规则与维护规则中一些常见的操作方式。
2024-09-20 16:51:54
713
原创 为什么企业可以通过数据产品实现商业价值
当人们在搜索数据时,仅从数据本体往往并不能获取他们想要了解的答案。“这是什么?如何使用?是否可信?面对一个新的业务需求,数据分析人员应该如何寻找到合适的数据,并合理利用起来。数据产品的出现正是为了满足这类需求,可以帮助数据从业者节省大量重复、琐碎的前置准备工作。“数据产品是对数据资产的封装,使其易于发现、理解并值得信赖,以解决关键业务问题。
2024-09-14 17:38:24
759
原创 3分钟带你了解什么是数据目录
什么是数据目录?数据目录,顾名思义就是“数据的目录”。这里的“数据”指的是元数据。数据目录通过管理这些元数据,形成一个可用的数据清单,使数据开发者、数据分析师等人员能够通过查阅和搜索等操作,快速找到所需的数据。此外,数据目录还提供了附加的元数据,以帮助用户进一步评估数据的可用性和一致性。已成为现代数据管理的核心部分,它显著提升了数据从业人员在数据处理和分析方面的工作效率。今天,我们简单聊一聊的话题。
2024-09-13 16:41:49
951
原创 为什么企业需要数据目录?
想象一下,如果在没有目录系统的庞大图书馆里寻找一本特定的书,你可能会耗费无数个小时搜索,但最终却一无所获。同理,企业的数据如果没有一个组织良好、易于搜索的系统,也无法充分发挥其潜力。企业数据目录能够简化这一过程,确保你能随时获取所需数据。对于数据分析师、数据科学家和数据管理者来说,挑战不在于可用数据的数量,而在于如何有效地发现、访问和利用数据。
2024-09-12 15:25:11
848
原创 利用数据质量工具提高业务效率 | 数据治理应用篇
在当今社会,企业管理者们愈发开始重视数据的重要性。数据不仅能推动战略决策,还能影响业务成果、推动创新,并为企业提供竞争优势。然而,随着数据量的增加,确保数据的准确性、一致性和可靠性成了数据从业人员面临的持续挑战。此时,数据质量工具就显得尤为重要。它们能够自动化地维护高质量数据,确保数据分析师、科学家和工程师更高效地开展核心工作。
2024-09-06 18:50:56
1069
原创 3分钟带你了解什么是元数据管理
文章主要介绍了元数据管理。元数据是关于数据的数据,为数据加 “标签” 以帮助理解和使用。元数据管理有助于提升数据可发现性、理解力、一致性及支持合规性。企业可选择合适数据平台实施元数据管理,如麦聪 DaaS 平台,其低代码属性方便业务人员操作,可实现统一管理、提升元数据可搜索性和可访问性,确保多部门参与,为数据驱动决策奠定基础,提高数据治理效率。
2024-09-04 17:54:20
808
原创 3分钟带你了解什么是数据治理?
这两年总听人聊起数据治理,这个词出现的频率越来越高,所以数据治理到底是干吗用的?首先,我们来看看看数据治理的定义。数据治理是指制定和实施一系列规则、流程和政策,以确保企业数据的质量、完整性、安全性和合规性。它包括数据的管理、控制和监督,确保数据在整个生命周期内得到有效管理和利用。数据治理不仅涉及数据的存储和处理,还包括数据的创建、使用、维护和销毁。听起来似乎太抽象了。让我们来换个说法。假设我们有一个大型图书馆,里面有数以万计的书籍,但是只能按照书籍的购入批次,被杂乱且无序的堆叠在一起。
2024-08-29 20:20:39
692
原创 Excel导入MySQL,一键导入轻松建表!用这个免费SQL工具就够啦
使用SQLynx快速导入Excel到MySQL,一键建表,轻松完成数据导入
2024-04-26 13:56:59
890
原创 只需3步,新手也能轻松完成mysql千万级数据迁移
相信各位日常开发中经常会遇到各种需要做数据迁移的业务场景,想要快速迁移又不想费劲敲代码?找个趁手的工具,可以让这个任务变得轻松又快捷,只需简单3步,新手也能直接上手!
2024-01-26 10:30:07
901
原创 一分钟带你创建百万测试数据,玩转软件测试
SQL Studio是一款安全高效的数据库管理工具,让你从单一数据库可同时连接Oracle、PostgreSQL、MySQL、SQLite、SQL Server、DM(武汉达梦)、KingBase(人大金仓)、MongoDB(Beta)、Hadoop等。准备测试数据是软件测试中非常重要的一个环节,无论是手工测试、动化测试还是性能测试,生成大量测试数据以评估性能是一项重要任务。我们先在对象窗格顶部的搜索栏,输入表名,快速定位对应的数据库、表,点击右键“生成测试数据”即可。的做法,准确度高但是创建效率较低。
2023-07-07 12:09:32
666
原创 既然有Map了,为什么还要有Redis?
代码更清晰,处理逻辑更简单;不用考虑各种锁的问题,不存在加锁和释放锁的操作,没有因为可能出现死锁而导致的性能问题;不存在多线程切换而消耗CPU;无法发挥多核CPU的优势,但可以采用多开几个Redis实例来完善;Redis是一个key-value存储系统,支持10种数据类型,总结了为何要用Redis替代map作为程序缓存、Redis为什么是单线程的、Redis的优缺点、Redis的常用场景,做了一次Redis的快速入门。
2023-05-06 11:48:30
1183
1
原创 Facebook 用户量十分庞大,为什么还使用 MySQL 数据库?
Facebook是一个拥有超30亿用户的互联网公司,拥有海量数据,而且增长很快,单机数据库完全无法满足这种需求。这时需要对数据进行分片,存储到多个数据库节点中,这个时候如果使用IOE作为其中一个节点,肯定可以保证很好的性能,但是成本就非常非常非常高了,要知道,Facebook的数据库服务器有成千上万台。。。这个社交网络巨头在使用添加了大量修改和附件的MySQL数据库,为每天数量庞大的数据传输和数据存储提供方便。你不能指望一家年收入数十亿美元的公司将MySQL直接拿来使用!
2023-05-05 17:12:35
965
原创 当我们说大数据Hadoop,究竟在说什么?
提到Hadoop,大家的理解是什么?狭义上理解,Hadoop指的是Apache软件基金会的一款用java语言实现,开源的软件,允许用户使用简单的编程模型实现跨机器集群对海量数据进行分布式计算处理。广义上,Hadoop指的是围绕Hadoop打造的大数据生态圈,如下图所示, 其中Hadoop是整个生态圈的底座、地基,构建出整个大数据的生态系统。
2023-04-27 09:30:00
918
原创 一款纯Web化免费SQL工具,重新定义数据库管理
SQL Studio是一款由麦聪软件研发的多数据库管理工具,提供Windows、Linux 和 MacOS三种版本的软件包,支持中英文两种语言。SQL Studio是用Java编写的,默认使用 JDK 8进行编译。下载看这里: [SQLStudio]SQL Studio 面向个人开发者提供免费使用,最新版本为SQL Studio 1.4.0。目前,SQL Studio 1.4.0支持的数据库不仅有MySQL、Oracel、PostgresSQL等主流数据库,还支持武汉达梦、人大金仓等。
2023-04-25 09:25:19
2884
原创 MySQL开发工具评测,包含了Navicat、DBeaver、SQL Studio等12种
面对五花八门的MySQL客户端,开发者该如何选择,今天我整理了12种MySQL开发工具,从产品体验,功能完整度,云适配,计费模式,OS先容性等多个角度进行评估与分析,大家可根据自己的实际情况选择、KingBase(人大金仓)等数据库,执行SQL、创建表、新建数据库、创建索引、以及导出数据等。最近看到一款数据库Web版工具,SQL Studio,是麦聪软件公司出品的,主打的就是一个,不使用任何的开源代码,产品由中国研发团队100%自主研发。支持自定义修改主题颜色。支持定位搜索到具体的表、视图、函数等。
2023-04-19 10:38:42
6732
3
原创 既然Linux是基于UNIX的操作系统,那为什么UNIX收费而Linux免费?
因此在后面的10年,UNIX在各个学术机构得到广泛应用,甚至许多机构在此源码基础上加以改进,其中最著名的变种之一是由加州大学柏克莱分校开发的BSD产品(Berkeley Software Distribution),在此基础上又诞生了三条分支:FreeBSD、OpenBSD和NetBSD,就连苹果电脑的内核Darwin所使用的NextSETP也是BSD的衍生版本。,不再将UNIX源码授权给学术机构,并对之前的UNIX及其变种声明了版权,后面引发了各种旷日持久的版权纠纷,这是UNIX的后话。
2023-04-17 09:39:39
1198
原创 国货之光!打工人必装的8个软件,你都用过没?|办公|效率|创作
Seer 是一款 Windows 下的文件预览工具,它几乎可以预览所有的文件格式,包括图片、视频、音频、Word、Excel、PDF、压缩文件等等,都可以通过按空格键实现快速预览,预览之后按空格键就能直接关闭。Seer 是一款 Windows 下的文件预览工具,它几乎可以预览所有的文件格式,包括图片、视频、音频、Word、Excel、PDF、压缩文件等等,都可以通过按空格键实现快速预览,预览之后按空格键就能直接关闭。用它还可录制出鼠标移动的效果图,根据鼠标的移动轨迹,形成一个拖尾的效果,看上去非常的炫酷。
2023-04-13 09:11:20
1104
原创 国产软件爆发!中国版Navicat,SQL Studio成数据库管理工具热门
官网介绍的比较中肯,我直接搬过来了:SQL Studio是一款可创建多个连接的Web版数据库管理开发工具,让你从单一应用程序可同时连接PostgreSQL、MySQL、SQLite、SQL Server、Oracle、DM(达梦)、KingBase(人大金仓)等数据库。主窗口直观完善的图形用户界面和强大的SQL编辑器功能极大简化了大家的数据库管理开发工作,随时随地的团队协作,完整的审计功能,让用户实现高效、安全的SQL开发,个人开发者可永久免费使用。(这句比较重点)
2023-04-11 10:44:22
5196
7
原创 阿里版 ChatGPT 突然上线!
熟悉ChatGPT的朋友应该都知道,就在本周,各个ChatGPT&AI群都在传一个消息:ChatGPT官方大面积封号,今天登录gpt千万别用亚洲节点!前几天率先流出的天猫精灵“鸟鸟分鸟”脱口秀版GPT,就是基于大模型的“压缩版”,已经以其惊艳表现吸引了众目光。百度的文心一言,阿里的通义千问,我相信中国很快还会出现更多类似ChatGPT这样的大模型,实力玩家入场,大模型之间的真正竞争,开始了!前有百度的文心一言,现有阿里的通义千问,国产AI产品的不断涌现,真的令人振奋。这种时候,最能凸显了技术自研的价值!
2023-04-10 10:14:44
12608
3
原创 为什么程序员都喜欢开源的软件?
先来感受一下开源与闭源:当你觉得这个软件有一个缺点影响使用的时候如果是闭源软件,你如果不想自己模仿着写一个,就只能考虑顺着网线到开发者脖子上逼着他加但开源软件你可以自己在他的基础上改一改,你改好了还拿回馈回去让更多人一起用鉴于顺着网线去对面程序员的脖子上的困难程度,自然开源软件的优越性也就不言而喻了不是所有程序员都喜欢开源。而是程序员大佬与超大型公司喜欢开源。
2023-04-06 14:21:37
1242
原创 原来count(*)是接口性能差的真凶
最近我在公司优化过几个慢查询接口的性能,总结了一些心得体会拿出来跟大家一起分享一下,希望对你会有所帮助。我们使用的数据库是Mysql8,使用的存储引擎是Innodb。这次优化除了优化索引之外,更多的是在优化count(*)。通常情况下,分页接口一般会查询两次数据库,第一次是获取具体数据,第二次是获取总的记录行数,然后把结果整合之后,再返回。它没有性能问题。却存在性能差的问题。为什么会出现这种情况呢?
2023-04-04 09:41:26
729
原创 国内IT软件外包公司汇总(2023 最新版)!
大环境不行,面试太少了,很多本科生想进外包都没机会。非常时期,不需要在意那么多,外包作为过渡也是没问题的,很多外包其实比小公司还要好多了。也不要太担心去外包会污染自己的简历,只要接触的项目还可以,写在简历上再润色一下,那就完全没问题的,放心!默默沉淀,提高个人竞争力,等待时机成熟再溜就好了。根据网上的资料,整理出来的一份国内软件外包公司的名单。找工作的同学都要看看,根据自身的情况,学历低的 、没有经验的,可以先到外包公司试试,或者不想进去的也要了解一下, 避免找工作时被坑了。
2023-04-03 09:38:45
2528
原创 这可能是我用过最好用的SQL工具,免费还免安装,良心推荐SQL Studio
数据库管理工具,是后端程序员使用频率非常高的的工具。Navicat、DataGrip虽然很好用,但都是收费的。最近发现了一款免费的数据库管理工具SQL Studio,界面非常简洁推荐给大家!
2023-03-28 11:53:58
17341
8
原创 单机分布式一体化是什么?真的是数据库的未来吗,OceanBase或将开启新的里程碑
解决了传统单机数据库的瓶颈问题:传统单机数据库往往会出现性能瓶颈、容量限制等问题,而单机分布式一体化数据库通过集成多个节点,可以实现横向扩展,提高了系统的性能和扩展性。提高了数据的可用性和可靠性:单机分布式一体化数据库可以将数据分布在多个节点上,实现数据备份和容灾,避免了单点故障,提高了数据的可用性和可靠性。支持多种数据模型和数据类型:单机分布式一体化数据库可以支持多种数据模型和数据类型,如关系型、非关系型、文档型、图形型等,满足不同的应用场景和需求。支持分布式事务和数据一致性。
2023-03-27 16:12:33
863
原创 面试官灵魂拷问[二]:SQL 语句中 where 条件后写上 1=1 是什么意思?
但实际上对于 svn/git 来说修改了两行,而修改的两行还存在冲突,不能自动归并(新增的6跟7都是尾部没有逗号的,合并了也编译不过)。你看上边,如果where绑定1=1,后边的每一个条件,都固定是 and 开头的格式,这样增加与删除条件时,都不会影响其他行,对版本管理记录变更来说非常清晰。有的项目为了解决这种烦恼,强制在enum末尾定义一个永远不用的常量,这样此常量之上增加的常量就永远可以有逗号了。SQL语句固化为 where 1=1 之后,每个附加的条件都是 and 开头,这样,每个附加条件都等价了。
2023-03-24 10:54:06
2642
原创 PingCAP都开始 裁员了,国产数据库还有救吗
2021年PingCAP的那一轮融资,仍记忆犹新。我记得PingCAP当时是差不多350人左右的人数融到了数亿美元,投后估值更是高达30亿美元。当时有些朋友说PingCAP真是炙手可热,很多投资人拿着钱想投都投不了,因为想投的机构太多了,可以说风头一时无二。
2023-03-22 15:51:21
3093
原创 最近很多人都在说 “前端已死”,讲讲我的看法
若没有开源文化,会不会互联网开发,也是一个越老越吃香的职业呢 [微笑]?我不知道,我是开源的受益者,我也愿意为开源做贡献,但是我不会期待它能给我带来多大的商业收益了,开源和商业付费之间,是两种文化之争;前端已死更多的是一种焦虑情绪的表达,市场确实不太好,但这并不是针对前端,整个互联网行业衰败的表现而已,对此持不同意见的怕是只剩培训机构了吧;前端老鸟,市场还是需要和欠缺的,只是对于初中级前端太卷了,我建议应届生不要继续入门前端了,搞搞嵌入式开发,或者芯片之类的,门槛高一些。
2023-03-22 14:35:27
1063
原创 程序员能有什么好出路?前路漫漫,望长风破浪!
关于职场的焦虑无处不在,而这些文章也加重了我们的焦虑。就我个人而言,我也仔细想过这个问题,其实从本质上来说,只是个“竞争力”的问题。如果你觉得自己没有竞争力了,那么你就会焦虑,而你又将焦虑的原因归结于一个你没办法改变的问题,那就是“年龄”。于是一个逻辑自洽的描述出来了:我30岁了,没啥竞争力,未来何去何从?
2023-03-22 11:33:04
569
原创 MySQL能干大部分事,为什么还要使用商业数据库或者PostgreSQL?
MySQL是一个开源的关系型数据库管理系统(RDBMS),它支持多用户、多线程和多个存储引擎,如InnoDB、MyISAM等。MySQL最初是由瑞典MySQL AB公司开发的,后来被Sun Microsystems收购,最终被Oracle公司收购。MySQL可以在各种操作系统上运行,包括Windows、Linux和Mac OS X等。PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS),在灵活的BSD许可证下发行。PostgreSQL 开发者把它念作 post-gress-Q-L。
2023-03-21 09:29:30
598
原创 面试官灵魂拷问:为什么SQL语句不要过多的join?
假设经过谓词下推,外表有m条数据,内表有n条数据,那么它join的时间复杂度是O(mn),如果内表的关联列上有索引,那就会降到O(mlogn),在现实中可能就是毫秒级和分钟级的区别。如果你不在数据库join,还要保证结果正确性,那可能就得把几亿,几十亿,几百亿的数据都查到应用端,这是网络不能承受的。另外,如果想减少join,设计上就要考虑更多冗余,而这些冗余字段,数据库优化器是不知道的,数据库的优化只能保证逻辑上是等价的,至于很多人说的mysql垃圾,好吧,mysql确实垃圾,但这根本不是问题的症结。
2023-03-17 09:48:21
527
原创 明明可以通过调用API来操作数据库,那么SQL还有存在的意义吗?
但是如果你只有简单的CRUD API的话,你可能需要拿到所有user.id 然后走一个for loop 去salary里面找到对应的id,从正确性上来说也说得过去,但是性能会非常捉急,再后来你会发现所有的优化 = 你在用户侧重新实现了一个join算法。但是15年后我们已经知道结果了,Mapreduce这种过度自由的框架其实并没有人玩的那么转,存活下来的都是sparkSQL,flinkSQL,Hive,Snowflake这些用SQL的产品。很多时候你认为的约束和不便,其实是性能提升的来源。
2023-03-16 09:24:40
574
原创 面试官:给你一段有问题的SQL,如何优化?(手把手带你优化一遍)
在面试的时候很多面试官喜欢问候选人这样一个问题:这里不能说完全错误,因为这些技巧确实可以提高SQL运行效率;但是也不能说完全正确,毕竟面试官是想问他具体怎么是做SQL优化的。如果接下来面试官接着问:到这一步的时候就有很多候选人做不好打了退堂鼓。他们有很扎实的理论知识,但是动手能力却差点火候。今天这篇文章就从实战的角度出发,带大家走一遍SQL优化的真实流程。
2023-03-13 10:19:16
733
原创 学这些语言工作更吃香,Python虽然再次摘得桂冠,但在就业需求中位居第一的还得是它!
IEEE Spectrum 2022 编程语言排名前十的分别是:Python,C,C++,C#,Java,SQL,JavaScript,R,HTML,TypeScript。2022 IEEE 编程语言榜单Python再次摘得桂冠。
2023-03-08 11:22:16
936
2022年中国数据中台行业调研报告
2022-11-07
如何分析探索广告营销数据(基于麦聪DaaS平台)
2022-07-25
TA创建的收藏夹 TA关注的收藏夹
TA关注的人