自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

渡江客涂鸦板

路漫漫其修远兮,吾将上下而求索...

  • 博客(569)
  • 资源 (10)
  • 收藏
  • 关注

原创 Linux运维入门教程(☆建议收藏☆)

在当下,Linux运维是每个企业都不能缺少的岗位,以服务为中心,以稳定、安全、高效为基本,可以确保公司的互联网业务能够7*24小时为用户提供高质量的服务,在企业或产品交付交付运行当中有着十分重要的地位和作用。.............................................

2022-07-12 09:33:19 10921 4

原创 存储研发工程师 & 数据开发工程师

存储研发工程师和数据开发工程师

2022-05-27 15:22:23 467

原创 Consul专题文章索引

Consul 简化了分布式环境中的服务的注册和发现流程,通过 HTTP 或者 DNS 接口发现。支持外部 SaaS 提供者等。

2018-03-06 19:25:32 2033

原创 Ext4专题文章索引

Ext4专题目录本索引主要记录Ext4学习过程中的原理分析、代码理解。

2017-08-10 13:26:23 2090

原创 白皮书 | 分布式存储发展白皮书(2023)

12月1日,在2023云原生产业大会上,中国信通院云大所联合华为、戴尔科技、IBM等分布式存储产业方阵成员单位共同发布《分布式存储发展白皮书(2023年)》

2023-12-08 08:58:54 57

原创 [FAST23论文导读]More Than Capacity- Performance-oriented Evolution of Pangu in Alibaba

本文介绍了Pangu存储系统如何不断地随着硬件技术和业务模型的发展而不断演进,提供具有100us级I/O延迟的高性能、可靠的存储服务。

2023-11-19 20:25:51 322

原创 【fast21论文导读】 Learning Cache Replacement with Cacheus

CACHEUS建立在LeCaR的成功之上。它在几个方面对LeCaR进行了改进。首先,虽然LeCaR主张使用经典的LRU和LFU,CACHEUS证明了使用更复杂的专家的重要性。其次,CACHEUS通过识别和消除其机器学习机制的冗余方面简化了LeCaR。第三,它创建了一个完全自适应的版本,也是轻量级的。最后,新的轻量级专家SR-LRU和CR-LFU改进了LeCaR的专家,以解决扫描和搅动这两个新的工作负载原语类型。通过这些改进,CACHEUS的表现优于LeCaR以及其他最先进的算法。

2023-11-12 22:57:13 772

原创 【sosp23论文导读】Ditto:一个弹性自适应分离式内存缓存系统

Ditto首先提出了一个以客户端为中心的缓存框架,以在DM的计算池中高效地执行各种缓存算法,只依赖于远程内存访问。然后,Ditto采用了一种分布式自适应缓存方案,该方案基于多个缓存算法的实时性能自适应切换到最适合的缓存算法,以提高缓存命中率。

2023-11-04 19:15:25 614

原创 论文阅读笔记(Clover: 计算与存储被动分离的分布式键值存储系统)

关于这篇论文的笔记。

2023-10-09 12:39:01 2328

转载 布隆过滤器技术原理及应用实战

在我之前实现的个人项目——分布式定时器 xtimer 中就使用到了布隆过滤器作为任务幂等性校验的辅助工具.该项目详细介绍见文章——基于协程池架构实现分布式定时器 XTimerxtimer 架构图如下:在 xtimer 中,定时任务的实际执行聚焦在执行器 executor 模块,是由上游 trigger 模块异步启动的,只能通过一种类似于 ack 的分片过期时间延长操作,保证到定时任务满足 at least once 的语义,但无法做到 exactly once 的语义.

2023-09-25 19:12:58 1029

原创 2023年企业级存储主要发展趋势

到2027年,有25%的企业组织计划采用NVMe-oF存储网络协议,相对于2023年中期不到10%的采用率,呈现出明显的增长趋势。截至2026年,专用NVMe SSD将在本地化部署中占据超过30%的份额,相较于2023年中期不到5%的水平,呈现出明显的增长趋势。到2028年,将有70%的文件和对象数据部署在一个统一的非结构化数据存储平台上,从2023年初的35%增加到70%。到2027年,至少40%的组织将部署数据存储管理解决方案,用于分类、洞察和优化,从2023年初的15%增加到40%。

2023-09-20 09:03:51 1191 1

原创 2023年非结构化数据管理报告

采用分析、分类和分段数据的工具和实践可以导致细致入微的数据管理策略:低优先级的数据存储在存档存储中,直到需要进行活动使用或可以删除为止,而高优先级的活动数据保留在最昂贵的顶级存储中。这些问题包括从敏感数据泄露到威胁公司知识产权和个人身份信息保护的通用语言学习模型(LLMs),再到伦理、准确性、数据源溯源的担忧,以及派生作品的版权问题,甚至是恶意行为者可能造成的威胁,这些都是企业和社会需要认真面对的问题。当前的AI浪潮迅速塑造了新的工作方式,带来了显著的生产率提升,改变了产品和服务的创造与分发方式。

2023-09-20 09:00:08 1135

原创 hive with tez:无法从链中的任何提供者加载aws凭据

hive with tez:无法从链中的任何提供者加载aws凭据

2023-09-19 11:36:52 1304

原创 各种存储性能瓶颈如何分析与优化?

分布式存储系统的核心设计思想是去中心化, 去中心化的难点主要在于是主控节点的去中心化,有主控节点的架构比如 HDFS 的架构设计思路是 map-reduce ,化大为小,分而治之,再合并处理,其架构中需要主控节点来协调,只是主控节点的负载都分发到了数据节点,数据节点上则存放着数据副本,每个数据副本又都分布在三个不同的数据节点上,如图 5 所示;随着数字化转型的深入,企业的 IT 系统建设也进一步加快,这一方面带来了数据量的急剧增长,另一方面也提高了数据的访问频率,存储的性能瓶颈的影响也会被进一步放大。

2023-09-19 08:59:41 1162

原创 对话ChatGPT:AIGC时代下,分布式存储的应用与前景

作为始终致力于行业创新应用与数据存储技术融合发展的国内领先存储厂商,今天我们“邀请”到ChatGPT对以下问题进行作答,看看它在回答存储专业问题方面的表现。

2023-09-19 08:53:11 1699

原创 AIGC数据处理与存储解决方案

针对在AIGC的场景下,如何解决在AIGC训练过程中数据的存储和数据处理的问题,杨冠军从三个方面进行介绍与解读:一是AIGC对存储提的新需求;二是介绍腾讯云可以给用户提供的整体存储解决方案;三是腾讯云提供的整体数据处理方案。

2023-09-19 08:47:50 1224

原创 HPC集群自动弹性扩缩的两种实现方式

弹性扩缩技术正在成为HPC集群中的一项重要技术。它可以根据实际需求动态调整集群资源,应对用户负载的波动。对于运维团队来说,自动弹性扩缩能够减轻集群运维负担,提高集群资源利用率,降低成本。

2023-09-18 14:29:54 1211

原创 2023:生成式AI与存储最新发展和趋势分析(上)

生成式AI的热潮在短时间内席卷全球,以一种势不可挡的趋势迅速出圈,在某一时间段,似乎出现了“除了IT行业,人人都是AI专家”的盛况。这一轮如火如荼的全民AI热潮迸发至今,业已过半载,待最初的烟花绚烂散去,现如今又情形何如?

2023-09-18 07:31:01 1281

原创 2023:生成式AI与存储最新发展和趋势分析(下)

近两年存储领域最大的里程碑事件应该是闪存赢得过半市场,Gartner 连续几个季度的市场分析数据中也多次都确认了这一点,固态存储取代机械硬盘的趋势不可逆转。在这一大背景下,有三个新发展方向日益引起更多关注,分别是存储新介质,可计算存储(存算一体)和进一步的极致性能追求。

2023-09-18 07:27:29 1193

原创 基于本地持久内存的并行一致性哈希文件系统CHFS

CHFS是一个利用计算节点的持久内存的自适应并行文件系统。该设计完全基于高度可扩展的分布式键值存储,采用一致性哈希算法。CHFS通过消除专用元数据服务器、顺序执行和集中式数据管理,提高了并行数据访问性能和元数据性能的可扩展性。

2023-09-18 07:23:39 1152

原创 【整理】text2kgbench: 语言模型根据本体生成知识图谱的能力

该论文的研究背景是大型语言模型(LLM)和基于本体的知识图谱(KG)在自然语言处理(NLP)任务中的性能提升。 过去的方法存在一些问题,该论文提出的方法通过从文本中生成KG并遵循给定的本体,解决了这些问题,并鼓励了新的方法。 本文提出了Text2KGBench,一个基准测试,用于评估语言模型根据本体从自然语言文本中生成KG的能力。该方法使用两个数据集和七个评估指标来评估抽取性能、本体合规性和LLM的"幻觉"。还提供了两个基准模型的结果。

2023-09-18 07:20:12 1365

原创 【整理】难得的中文开源数据集

上海人工智能实验室搞了一个OpenDataLab,上面发布了5000+的中文的开源数据集,可以随意下载下来,用来训练自己的AI大模型的,真的是功德无量啊。

2023-09-18 07:18:31 1560

原创 技术人员怎样提升对业务的理解

人与人之间最大的差别是思维方式。只有思维方式持续不断升级,我们才有可能站得更高走得更远,与诸君共勉。

2023-09-15 15:06:27 1226 1

原创 基于 Alluxio 构建统一数据接入层

Alluxio 在知乎的多云架构中发挥了重要作用,为我们解决了数据安全、跨云、专线流量等一系列问题,为知乎的数据处理和模型训练提供了高效、安全、便利的解决方案。在未来,我们将继续深入挖掘 Alluxio 的潜力,探索更多的应用场景,为知乎的技术发展贡献更多的力量。

2023-09-13 09:09:06 1198

原创 一文了解数据科学Notebook

主要介绍什么是Notebook,Notebook在数据科学领域的应用的重要性与优势,以及数据科学家/算法团队在选择Notebook时需考虑哪些关键因素。同时,基于Notebook的筛选考量维度,对常见的Notebook进初步对比分析,为数据科学家、算法工程师提供参考。

2023-09-11 09:42:18 1216

原创 【前沿】数据目录是什么?您为何需要它?

数据目录就是关于企业数据资产的一个有序清单。它可以使用元数据来帮助企业管理数据,帮助数据专业人员收集、组织、访问和充实元数据,从而为数据发现和治理提供支持。

2023-09-08 09:22:46 942

原创 数据资产管理:数据目录怎么搞?

数据治理定义了数据管理的总体策略,规定了数据管理的组织、制度和流程,明确了数据的权属,定义了数据标准,为数据资产管理指明方向。数据资产目录是数据治理策略的具体执行,以业务友好的方式展示企业的数据资产和位置,帮助用户更好地找到、理解和使用他们的数据。

2023-09-07 19:54:21 1066

原创 浅谈数据治理中的智能数据目录

IBM很早就认识到将机器学习应用到数据管理的重要性,在IBM的Cloud Pak for Data中,机器学习无处不在,遍布数据集成、自动化数据管理、多云数据整合、数据准备、建议和数据洞察

2023-09-07 19:35:50 864

原创 数据分类分级流程

随着互联网的快速发展和大数据时代的到来,数据分类和分级成为了数据管理中的重要环节。数据分类分级的目的是为了让数据更加有序、易于管理和利用。本文将从数据分类分级的概念、流程和方法等方面进行介绍。

2023-09-05 10:12:43 1030

转载 Milvus 2.1 版本更新 - 简单可信赖、性能持续提升

继年初发布 Milvus 2.0 版本之后,在数百位 Milvus 社区贡献者六个月的共同努力下,我们在早些时候发布了 Milvus 2.1 版本,经过两个月的数次迭代,版本趋于稳定,被国内外头部厂商信任和选择使用。在此次大版本更新中,最为重要的两个关键词莫过于:易用性和性能。

2023-09-05 08:43:33 270

转载 纠删码技术在vivo存储系统的演进【上篇】

本文将学术界和工业界的纠删码技术的核心研究成果进行了相应的梳理,然后针对公司线上存储系统的纠删码进行分析,结合互联网企业通用的IDC资源、服务器资源、网络资源、业务特性进行分析对原有纠删码技术进行优化和微创新,提出了融合EC整体方案以及可落地的RS+LRC+中间结果优化+并行修复跨AZ带宽设计方案,为后续的工程实践提供重要原理和架构支撑。

2023-08-24 17:34:26 243

翻译 翻译:2023年企业数据存储的主要趋势

受云启发的运营模式、先进的闪存技术、网络安全和数据洞察力都是2023年企业最热门的存储趋势。基础设施和运营领导者必须优先考虑这些技术和存储平台,以保持领先于业务需求。

2023-08-16 20:00:00 361

转载 DAOS 分布式异步对象存储|控制平面

DAOS 通过两个紧密集成的平面进行运转。数据平面处理繁重的运输操作,而控制平面负责进程编排和存储管理,简化数据平面的操作。

2023-08-16 00:30:00 303

转载 DAOS 分布式异步对象存储|数据平面

DAOS 通过两个紧密集成的平面进行运转。数据平面处理繁重的运输操作,而控制平面负责进程编排和存储管理,简化数据平面的操作。

2023-08-16 00:30:00 371

转载 DAOS 分布式异步对象存储|相关组件

DAOS 的安装涉及多个组件,这些组件可以是集中式的,也可以是分布式的。DAOS 软件定义存储 (software-defined storage, SDS) 框架依赖于两种不同的通信通道:

2023-08-16 00:15:00 327

转载 DAOS 分布式异步对象存储|分层和服务

基于服务的架构提供了灵活性和可扩展性,它与一组基础架构库相结合,这些库提供了可供所有 DAOS 服务访问的丰富软件生态系统。

2023-08-16 00:15:00 353

转载 聊聊daos高性能分布式存储

Daos(Distribute Asynchronous Object Storage)是基于非易失内存(NVM)构建的一个开源自定义对象存储.daos提供key-value存储接口和提供non-bloking I/O、数据的多版本、快照等功能。Daos存储系统充分利用了下一代的NVM技术,比如SCM(Storage Class Memory)和NVMe(NVM express).采用kernel bypass技术,端对端的运行在用户态,在执行IO操作期间不需要任何的系统调用。

2023-08-15 19:52:28 444

转载 DAOS 分布式异步对象存储|架构设计

​分布式异步对象存储 (DAOS) 是一个开源的对象存储系统,专为大规模分布式非易失性内存 (NVM, Non-Volatile Memory) 设计,利用了 SCM(Storage-Class Memory) 和 NVMe(Non-Volatile Memory express) 等的下一代 NVM 技术。

2023-08-15 19:36:01 373

原创 基于鲲鹏平台Ceph深度性能调优

刘亮奇随着 IOT、大数据、移动互联等应用的暴涨,产生的数据也越来越多,整个存储市场总量也逐年增长,预计到 2021 年分布式存储会占到整个存储市场的 50%,到 2027 年,分布式存储会占到整个市场的 70%。Ceph 则是典型的分布式存储软件的代表。杉岩数据作为一家软件定义存储商,软件的发展与硬件的结合密必不可分,与华为共建 ARM 生态是杉岩发展的关键着力点。目前,杉岩数据的对象存储 MOS 和块存储 USP 已完成在鲲鹏平台的适配工作,且可进行商用。

2023-08-15 00:15:00 475

原创 Ceph读写性能估算方法

最近在做Ceph性能测试相关工作,在测试初期由于没有得到理想的测试结果,因此对Ceph集群进行了优化,但是一直有个问题萦绕在我的脑海:基于当前硬件配置,这个Ceph集群的极限是多少?

2023-08-14 01:30:00 400

翻译分布式文件系统:BeeGFS vs GlusterFS.pdf

评估了在广泛变化的条件下Fraunhofer(FhGFS)和Gluster(Glfs)在多个硬件平台上的分布式文件系统技术。虽然我们大多数测试条件的变化使得很难进行直接比较,但我们可以提出一些有用的评论

2023-08-16

2023东北证券-计算机行业AI深度报告,向量数据库:AI时代的Killer+App-230508.pdf

2023东北证券-计算机行业AI深度报告,向量数据库:AI时代的Killer+App-230508.pdf

2023-08-15

计算机:CPU生态价值与机遇研究.pdf

新兴领域发展迅猛,CPU未来发展可期。伴随5G、云计算、物联网、大数据、人工智能等创新领域的发展,对算力的需求也大幅增加,CPU作为科技领域的算力支撑后续需求有望迎来发展机遇。具体来看,无论是5G、云计算、大数据相关的科技领域基础设施的搭建,还是5G手机、AR/VR等终端设备的更新更替,还是人工智能、智能驾驶等应用层级的创新,均对算力提出了更高的要求。后续CPU在这些领域的增量应用或将打开CPU更大的市场空间。

2023-08-15

大数据+物联网智慧水务解决方案.pdf

智慧水务通过数采仪、无线网络、水质水压表等在线监测设备实时感知城市供排水系统的运行状态, 并采用可视化的方式有机整合水务管理部门与供排水设施,形成“城市水务物联网”,并可将海量水务信息进行及时分析与处理,并做出相应的处理结果辅助决策建议,以更加精细和动态的方式管理水务系统的整个生产、管理和服务流程,从而达到“智慧”的状态。 为保证供水工作的科学性提供数据分析,可及时发现管网故障,提高维护效率、 降低损失,保障输水、供水质量,达到科学预警,减少成本,提高效率的目的。

2023-08-15

2022中国图计算技术及应用发展研究报告.pdf

近年来图计算学术研究领域发展迅速。近年来图计算学术研究领域发展迅速,从2014年到2021年间,图计算领域论文数量呈现翻倍增长趋势,其中以中美两国学者为首。目前,清华大学、北京大学、中国科学院以及华中科技大学等是国内图计算领域研究的先驱,贡献了中国大多数高被引用图计算论文。 图计算产业应用正在大步向前推进。现阶段,图计算领域参与者不仅有互联网/公有云厂商(如蚂蚁、腾讯、AWS、Microsoft Azure等),还有一众垂直图计算企业(如Neo4j、TigerGraph、创邻科技、欧若数网等)、传统数据库厂商(Oracle、IBM等)也已经入局。

2023-08-15

金融行业信创云基础架构方案评估.pdf

IT基础设施是指运行和管理企业IT环境所需服务器、网络、数据存储等组件,为业务系统的运行提供所需的计算、存储、网络资源,因此,IT基础设施是保障业务系统稳定运行、并提升其运行效率的基础。私有云基础设施是部署在企业内部,符合云特性的IT基础设施(IaaS),具备使用简单、可按需投资、敏捷上线、自助使用、计费等“云”特性,同时其部署和运维需要足够简单,从而匹配企业的运维能力。

2023-08-15

计算产业发展简史及趋势

以“信息技术”为特征的第三次工业革命,将世界带入了数字化时代;以“智能技 术”为特征的第四次工业革命,目前正在席卷全球,将会把人类社会带入智能化时 代。 计算已经进入3.0时代。从最早期的大型机、小型机时代,是专用计算,我们称之为计算1.0。到了x86时代,在Intel的带领下,在摩尔定律的驱动下,计算由专用走向了通用,大量数据中心开始出现,也是当前计算产业所处的阶段,我们称之为计算2.0。随着数字化程度的加速发展,世界逐步走向智能化,计算已经不仅仅局限于数据中心,也不仅仅局限于为走向了全栈全场景,我们称之为计算3.0时代,而这个时代的主要特征就是“智能”,所以我们也称之为“智能计算”。

2023-08-15

2021全球加密技术发展趋势研究

2021全球加密技术发展趋势研究;了解组织如何跨多个云保护数据, 以及如何比对你的加密策略。第一部分 执行概要,第二部分 重要发现,加密的策略和应用,加密技术应用趋势,威胁、 主要驱动因素和优先事项……

2023-08-15

人工智能安全隐私和应用案例

人工智能安全隐私和应用案例

2023-08-15

存储基础知识培训(共计17页)-DELLEMC

存储基础知识、存储分类、存储产品选型

2022-09-04

存储基础知识课程(共计57页)

存储是什么、 磁盘技术基础、 存储技术基础、 存储系统类型、 存储高级技术

2022-09-04

2022 分布式存储市场调研报告 + 分布式存储

如果从业务创新应用的角度出发,应该将注意力更多集中在应用,而不是存储技术细节,但是另外一方面,这些不同的技术也是针对业务实践中暴露出来的问题应运而生,代表着应用管理的先进水平,其中很多的问题会随着数据量的增加,以及硬件故障的增多逐步暴露出来,因此对于技术的关注还是非常有必要的。人的认知往往跟不上技术的发展,在一定程度的混淆。《2022 分布式存储市场调研报告》结合专家们多年的工作经验,希望能够给行业企业的用户实践提供参考和依据,推动分布式存储技术的应用和发展。

2022-05-18

企业云数据中心解决方案.pptx

企业云数据中心解决方案

2021-08-01

下一代数据存储技术研究报告(2021年)

本报告聚焦于企业级存储系统, 从数据存储技术面临的挑战切 入,详细梳理了下一代数据存储技术,跟踪重点行业的应用动态, 并展望了存储产业发展趋势。 力图展现下一代数据存储技术路径及 其发展前景。

2021-08-01

fio-2.14.tar.bz2

FIO是一个开源的I/O压力测试工具,主要是用来测试磁盘/SSD的IO性能,也可测试cpu,nic的IO性能。它可以支持13种不同的I/O引擎,包括:sync, mmap, libaio, posixaio, SG v3, splice, network, syslet, guasi, solarisaio, I/O priorities (针对新的Linux内核), rate I/O, forked or threaded jobs等。

2017-05-03

DirectFB-1.7.1

DirectFB库源码文件

2016-05-24

DirectFB_Reference_1_6.7z

DirectFB 开发文档

2016-05-24

Linux中LCD设备驱动

帧缓冲(framebuffer)是Linux 系统为显示设备提供的一个接口,它将显示缓冲区抽象,屏蔽图像硬件的底层差异,允许上层应用程序在图形模式下直接对显示缓冲区进行读写操作。用户不必关心物理显示缓冲区的具体位置及存放方式,这些都由帧缓冲设备驱动本身来完成。

2013-11-06

linux LCD编程示例

Linux下的帧缓冲lcd应用编程示例 内含三个文件,请执行make

2013-11-06

UBIFS文件系统介绍

中文版。 UBIFS, Unsorted Block Image File System,无排序区块图像文件系统。它是用于固态硬盘存储设备上,并与LogFS相互竞争,作为JFFS2的后继文件系统之一。真正开始开发于2007年,并于2008年10月第一次加入稳定版本于Linux核心2.6.27版。

2013-10-17

.vimrc配置文件

修改文件名为.vimrc 存放在根目录下

2011-12-10

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除