- 博客(163)
- 资源 (5)
- 收藏
- 关注
原创 电源、PCIe 扩展槽、管理端口
H3C UniServer R4900 G5 在电源、PCIe 扩展槽、管理端口及其他接口的设计上,充分体现了企业级服务器 “可靠性、扩展性、易管理性” 的核心需求
2025-11-25 21:41:24
47
原创 如何理解采用单条 384GB DDR4 LRDIMM,32 插槽可构建 12TB 纯 DRAM 内存池
要理解 “采用单条 384GB DDR4 LRDIMM,32 插槽可构建 12TB 纯 DRAM 内存池”,核心是通过 “单条容量 × 插槽数量” 的基础计算,结合服务器内存设计逻辑来拆解,具体可从以下三方面理解
2025-11-25 21:32:59
41
原创 数据管理战略|流程与IT变革、量化闭环
数字化改革是推动实现治理、服务量化闭环的主要手段”(可以理解为量化闭环没那么容易做,需要变革作为手段)量化闭环体现了工作的成熟度,定性是治理、服务的初级阶段,量化是治理和服务的深化,闭环是根本要求。通过数据资源的开发利用,对业务流程进行流程再造,实现量化闭环,激发数据生产要素对经济社会发展的放大、叠加、倍增作用
2025-11-12 13:10:40
37
原创 数据管理战略|3角色和组织的描述、及其权责的概要描述
本文继续具象化理解DAMA数据管理第一章的数据管理战略组成部分的第7):数据管理角色和组织的描述、及其权责的概要描述。
2025-11-12 13:09:38
26
原创 数据管理战略|数字化改革的四个体系
本文讲DAMA数据管理战略的组成第6)部分:符合SMART(具体的、可衡量的、可执行的、现实的、有时间限制的)原则(12-24个月)数据管理计划目标。这也是一个抽象的概念,该如何下手。我觉得用四个体系来具象化比较合适.四个体系不仅适用场景应用建设,也适用于数据管理。
2025-11-11 21:47:46
49
原创 数据管理战略|3数据管理成功的预期衡量标准|螺旋上升
数据管理成功的预期衡量标准。标准怎么定义?从什么角度,不同企业/政务结合自己的业务,规划的可能都不一样。有没有通用的范式来具象化?
2025-11-11 21:44:37
56
原创 DAMA 第一章 数据管理战略|3数据管理成功的预期衡量标准|指标举例
如下指标是实际开展数据管理工作用到的,不是标准,列出来是为了读到此处时,对衡量指标具像化一些,写方案时有所参考。包括数据治理成熟度指标、业务赋能与价值创造指标、数据安全与合规指标、数据要素市场化指标、系统支撑能力指标
2025-11-11 10:40:27
37
原创 数据管理战略|2数据管理的使命和方向性目标
使命(Mission):是组织存在的根本目的和价值追求,回答 “组织为什么存在”“我们要成为什么” 的终极问题,是组织的 “初心” 和长期方向。它具有纲领性和哲学性,通常不随时间轻易改变,是组织战略的 “原点”
2025-11-10 10:19:24
31
原创 数据管理战略|1概念及组成部分
【小语】前面两个文章讲到了“数据管理战略数字化转型、数据驱动”三者之间关系,数字化改革中的原则与逻辑,本节用三次文章学习数据管理战略内容的组成部分(DAMA数据管理第1章1.2.6节)。下文为【原文内容,蓝色标注的为扩展内容】战略是一系列选择和决策的集合,是组织高层共同制定的实现高层次目标的高阶行动计划。在国际象棋游戏中,战略是一系列有序的动作,旨在通过将死获胜或平局生存。战略计划是实现高层次目标的高层行动计划。数据战略应包括利用信息获得竞争优势和支持企业目标达成的业务计划。
2025-09-10 17:12:27
60
原创 DAMA数据管理|4数据管理的挑战-元数据和数据管理
为了将数据资产进行管理,组织需要可靠的元数据,元数据不仅包括业务、技术和操作元数据,还嵌入在数据架构、模型、安全需求、数据集成和数据运营流程中,它描述数据是什么、代表什么、分类、来源、流转、使用权限、质量等。数据架构、模型、安全、集成、运营的元数据,是数据治理的 “神经末梢”—— 架构元数据定 “骨骼”,模型元数据赋 “血肉”,安全元数据筑 “铠甲”,集成元数据连 “血管”,运营元数据保 “活力”。清晰数据治理的边界,避免重复建设。还包括数据模型元数据、数据安全元数据、数据标准元数据、运营流程元数据。
2025-09-10 15:01:31
53
原创 DAMA数据管理|4数据管理的挑战-元数据和数据管理
为了将数据资产进行管理,组织需要可靠的元数据,元数据不仅包括业务、技术和操作元数据,还嵌入在数据架构、模型、安全需求、数据集成和数据运营流程中,它描述数据是什么、代表什么、分类、来源、流转、使用权限、质量等。数据架构、模型、安全、集成、运营的元数据,是数据治理的 “神经末梢”—— 架构元数据定 “骨骼”,模型元数据赋 “血肉”,安全元数据筑 “铠甲”,集成元数据连 “血管”,运营元数据保 “活力”。清晰数据治理的边界,避免重复建设。还包括数据模型元数据、数据安全元数据、数据标准元数据、运营流程元数据。
2025-09-10 14:41:05
69
原创 DAMA数据管理|4数据管理挑战-规划先落地
【小语】做数据规划,得用数据打通业务、让技术适配业务、靠系统管好数据、拿数据支撑战略,还得战略层面统筹设计、业务 IT 携手,靠项目扎实落地,这样才能真拿到 “更好的数据”,服务企业。为了规划得到更好的数据,一方面需要对数据的架构、建模或其他相关设计职能采取一些战略性的方法;此时数据是沟通桥梁,业务流程产生的数据反馈给IT,促使迭代升级,让技术持续适配业务,形成“业务-技术&平台-数据”正相循环。战略落地支撑:通过分析数据,指导市场进入策略、产品适配调整,让战略落地有“数据依据”,不盲目。
2025-09-09 14:19:47
39
原创 不求甚解之数据管理|4数据管理挑战-质量严管控
【小语】组织得认清数据质量是数据管理的 “命根子”,懂低质量数据坑人、高质量数据帮人,还得从流程、协作、全生命周期管控等方面,把数据质量真落地,这样数据才能好好服务业务,给组织创造价值
2025-09-08 20:14:48
47
原创 python数据分析工具特点分析
ndarray(N-dimensional array)是 NumPy 的核心数据结构,是一个存储同类型元素的多维数组。同质性:数组中所有元素必须是相同数据类型(如整数、浮点数),保证内存存储高效。多维性:支持 1 维(向量)、2 维(矩阵)乃至更高维的数组,可灵活表示复杂数据结构(如时间序列、图像像素矩阵等)。高性能:基于连续内存块存储,配合预编译的底层代码(C 语言实现),大幅提升数据访问和运算速度,远超 Python 原生列表。
2025-09-08 20:10:00
897
原创 Python的价值:突出在数据分析与挖掘
Python 工具在数据分析领域不可替代的核心价值。通过 Python 工具的组合应用,构建一套 “发现问题 - 处理数据 - 分析建模 - 落地应用” 的完整解决方案。无论是中小企业的市场分析、科研人员的实验数据处理,还是大型企业的业务监控,都能通过适配场景的工具组合,最终实现 “用数据驱动决策” 的目标。Python突出其在效率提升、决策支持、问题解决等方面。
2025-09-04 08:21:46
770
原创 (Python)数据分析:概念和流程
狭义数据分析是指根据分析目的,采用对比分析、分组分析、交叉分析和回归分析等分析方法(位于上图技术层的算法模型和通用技术),对收集的数据进行处理与分析,提取有价值的信息,发挥数据的作用,得到一个特征统计量结果的过程。通过对比分析、分组分析、交叉分析、回归分析等分析方法,以及聚类模型、分类模型、关联规则、智能推荐等模型与算法,发现数据中有价值的信息,并得出结论的过程。主要内容:依据业务、生产和财务等部门的需求,结合现有数据情况,提出数据分析需求的整体分析方向与分析内容,最终与需求方达成一致意见。
2025-09-04 08:21:18
699
原创 Python的地位:在数据科学与多领域应用发挥作用
Python 在数据科学及相关领域的强大生态系统,能为不同岗位、不同场景的数据分析与应用提供解决方案,Python 凭借其简洁易读的语法、丰富的库支持,成为数据科学等领域的首选编程语言之一。
2025-09-03 09:19:54
986
原创 python数据分析 与spark、hive数据分析对比
Python 数据分析与 Spark、Hive 数据分析在应用场景、数据处理能力、编程模型等方面存在差异
2025-09-03 08:27:59
1044
2
原创 从苏州姑苏区人工智能大模型基础设施招标|学习参数5:单颗 AI 处理器的内存带宽如何达到 1600GB/s
招标参数5:配置≥8 个AI 处理器,支持OAM式集成服务器形式。单个 AI 处理器支持≥370TFLOPS@FP16或 80TFLOPS@FP32 算力,支持≥64GB HBM高带宽内存,单个AI处理器内存带宽≥1600GBps
2025-08-09 10:26:50
147
1
原创 从姑苏区人工智能大模型基础设施招标|学习服务器、AI处理器、GPU
既不是传统意义上的服务器,也并非等同于一张 GPU 卡,如何选择?选AI处理器:若任务以低精度推理为主(如安防监控、手机助手),或需极致能效(如无人机、可穿戴设备),且能接受专用工具链的学习成本。选GPU卡:若需训练大模型、处理复杂混合负载(如游戏开发、科学模拟),或依赖通用编程生态快速迭代算法。
2025-08-09 10:24:01
65
原创 ZJ“XX智审”综合集成应用系统项目招标需求
浙江省公安厅部署推进“公安大脑”建设,浙警智审平台是公安审计数字化改革的技术载体,是技术、机制、体制“三轮驱动”的基础底座,是新理念、新路径、新技术、新机制一体推进的综合集成。更多见合集《浙警智审场景应用的理论基础与实践价值》一文。
2025-08-06 12:10:11
906
原创 十分钟透彻明析认知大模型背后强化学习+慢思考及提升潜力
本文从大模型技术底层逻辑出发:先拆解大语言模型(LLM)本质,对比传统模型,揭示大模型如何突破概率统计,掌握语言智慧;再深入技术支撑,解析 Transformer + Attention 架构如何处理长程依赖,适配复杂任务;接着探讨大模型掌握语言知识的路径,从词法句法到推理能力逐一拆解;也不回避局限,点明当前框架在数据、长文本建模、创意任务的不足;更展望突破方向,从数据、反馈、算法创新到多模态 + 具身智能,展现大模型向通用智能进阶的潜力,最后关联人工智能发展浪潮,看大模型如何成为智能实现的关键拼图
2025-08-05 23:54:02
1010
原创 大模型|极简说清“数据并行”
核心逻辑:“多设备保存完整模型、拆分数据并行计算” 。当训练数据量非常大(比如一次训练出要处理百万级样本)单卡(如 GPU)处理速度慢时,将数据拆分到多个设备(如多 GPU)上,每个设备上都保存完整的模型副本。每个设备用自己分到的部分数据独立计算梯度,然后所有设备的梯度汇总、平均,再同步更新所有设备上的模型参数。
2025-08-05 23:46:34
461
原创 高质量数据集|从武汉光谷《面向科技情报大模型的高质量数据集建设》招标项目谈起
2025 年 7 月 25 日, 武汉光谷数字产业集团有限公司发布《面向科技情报大模型的高质量数据集建设项目》招标公告,预算 6000 万元。招标内容:高质量数据集建设相关的硬件、软件及数据等内容。服务期限:2025 年 12 月 31 日前通过项目最终验收。其他:软硬件免费质保期为最终验收合格后 3 年;免费运维服务期为最终验收合格后 1 年。
2025-08-03 23:24:05
783
原创 高质量数据集|建设三大难点
25年3月国家数据局发文“建设高质量数据集,让人工智能更聪明”,提到“高质量数据集构建是一项复杂而关键的任务,需要了解模型应用场景和需求,进而开发、构建和维护数据资源,提供持续有效的高质量数据集”。5月中国信息通信研究院人工智能研究所发文 “从“经验驱动”到“标准驱动” 推动人工智能高质量数据集建设”,提出高质量数据集建设的 “三大难点” ,本质上揭示了当前数据工程从 “量的积累” 转向 “质的提升” 过程中,在目标对齐、流程管理、技术支撑三个核心维度存在的系统性障碍。
2025-08-03 23:18:02
274
原创 高质量数据集|大模型技术正从根本上改变传统数据工程的工作模式
DeepSeek 的实践本质上是:用大模型自身的能力(推理、生成)反哺数据工程,让数据从 “被动被处理的对象” 变成 “主动支撑模型进化的资源”。这种重构不仅提升了数据工程的效率,更让数据能直接服务于模型核心能力(如推理)的突破,最终推动大模型从 “能对话” 向 “能解决复杂问题” 升级。
2025-08-03 23:14:17
254
原创 关于人工智能AI>ML>DL>transformer及NLP的关系
Transformer是一种基于自注意力机制的深度学习模型,由Google2017年提出。彻底改变了NLP领域的序列建模方式,它通过并行计算和全局依赖建模,解决了传统循环神经网络(RNN)的长距离依赖难题,成为现代大模型(如BERT、GPT)的基石
2025-08-02 21:12:53
431
原创 “人工智能+政务服务”辅助审批项目成交结果公告|120万、四类场景
服务范围:“人工智能+政务服务”辅助审批项目主要围绕以下四类场景打造各项功能。一是智能审批,支持基于特定的审核规则,对各类待审文本进行全面而智能的判断。二是智能审查,智能评估采购需求文件的完整性、公正性和合规性。三是智能分析,具备对涉企诉求进行深度分析的功能。四是内资企业登记数智员工,定制开发机器视觉交互模块,基于业务规则库构建专用大模型,自动化完成业务相关操作。
2025-08-02 21:06:15
162
原创 “人工智能+政务服务”辅助审批项目需求及方案
项目需求:“人工智能+政务服务”辅助审批项目主要围绕以下四类场景打造各项功能。一是智能审批,支持基于特定的审核规则,对各类待审文本进行全面而智能的判断。二是智能审查,智能评估采购需求文件的完整性、公正性和合规性。三是智能分析,具备对涉企诉求进行深度分析的功能。四是内资企业登记数智员工,定制开发机器视觉交互模块,基于业务规则库构建专用大模型,自动化完成业务相关操作。
2025-07-31 16:17:01
290
原创 苏州姑苏区人工智能大模型基础设施招标|学习参数8-11:硬盘、PCIe 插槽、风扇、电源
8 个小盘位(默认配置):“小盘位” 通常指支持 2.5 英寸硬盘(如 SSD、SAS/SATA 硬盘),这类硬盘体积小、转速快(如 10K/15K 转)、抗震性较好,适合对存储速度和密度要求高的场景(如数据库、虚拟化)。25 盘位和大盘位机型(可选):25 盘位属于高密度存储配置,通常支持2.5英寸硬盘(部分可兼容1.8英寸),总存储容量可轻松突破数10TB,适合需要海量存储的场景(如日志服务器、备份中心);风扇具备超细分,风扇权限划分功能,可以根据温度变化独立调节转速,实现更有针对性的散热。
2025-07-31 08:19:58
69
原创 ELK Stack深入浅出视频课程
Elasticsearch 通常用于实现复杂搜索和分析功能,能够处理近实时的搜索请求,并且具有高扩展性和高可靠性。Logstash 是一个服务器端数据处理管道,能够同时从多个来源采集数据,对数据进行处理(例如过滤、转换等),然后将数据发送到指定的存储库中。Kibana 是一个开源的分析和可视化平台,它能够让用户在 Elasticsearch 中搜索、查看和交互数据,并通过图表、地图和仪表板等多种形式进行数据可视化。wx扫下图,回复“ELK视频”,即可获取下载地址,若失效,司信,一起学习探讨。
2025-07-30 11:03:01
314
原创 Kafka简述及学习课程
Kafka是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者在网站中的所有动作流数据。这种动作(网页浏览,搜索和其他用户的行动)是在现代网络上的许多社会功能的一个关键因素。对于像Hadoop一样的日志数据和离线分析系统,但又要求实时处理的限制,这是一个可行的解决方案。Kafka的目的是通过Hadoop的并行加载机制来统一线上和离线的消息处理,也是为了通过集群来提供实时的消息。链接: https://pan.baidu.com/s/1BBS2JnS2kYC2o4kHVrsPxQ 提取码: q7us。
2025-07-30 10:50:23
283
原创 姑苏区人工智能大模型基础设施|参数1-3:服务器整体
服务器与普通个人电脑(PC)在硬件构成上类似,都包含CPU、内存和硬盘等核心组件。然而,服务器的应用场景更偏向于企业级的核心业务需求,例如数据处理、文件存储和应用支持等。因此,在可靠性和管理性等方面,服务器与普通PC存在显著差异。
2025-07-29 10:50:42
63
原创 苏州市姑苏区人工智能大模型基础设施能力提升项目采购公告|总体解读
本建设内容体现了目前政务AI建设的共性:租用算力资源,定制办公、服务和治理场景,并组件化,包括政策查询、政策匹配、知识库问答、多模态文件数据治理、音频数据处理、办公PPT生成、多源数据融合数据底座、AI工作流、API服务接口及安全网关、地图服务。
2025-07-29 10:45:10
867
原创 方案必备|大语言模型对话接口及上下文管理
选用何种模型(选“合适的大脑”),不同模型就像不同能力的助手,比如GLM-4-Plus适合复杂对话(像写方案、深度问答),GLM-4-Flash适合简单高频场景(像客服自动回复)。c.成本控制 :对话越长,消耗的“token”(类似字数计费单位)越多,要告诉客户“精简记忆本”能省钱,比如删掉重复内容,每月能省“30%”费用。messages(对话“记忆本”):记录所有对话内容(用户问了什么,助手答了什么),模型靠这个“记住”上下文,比如用户先问“价格”,再问“优惠”, 模型能关联起来。
2025-07-24 04:51:22
141
原创 技术详解|多轮对话的上下文管理(如何动态添加对话历史、控制上下文长度以节省 token)
对早期对话进行摘要,用简短摘要替代原始内容(适合需要保留关键信息的场景)。"""对早期对话生成摘要(调用模型自身进行压缩)"""# 提取需要摘要的历史(例如前5轮)if len(messages) <= 2: # 只有系统提示+1轮对话,无需摘要# 分离系统提示和早期对话early_messages = messages[1:-4] # 排除最近2轮(保留最新内容)recent_messages = messages[-4:] # 保留最近2轮(用户+助手各2条)# 生成早期对话的摘要。
2025-07-24 04:50:59
278
原创 内容梳理|新手体会大模型AI接口调用
学习目标】1.先掌握API 调用流程:注册平台→获取 API Key→安装 SDK→编写基础调用代码。2.理解对话上下文管理:messages的结构、角色分工、多轮对话逻辑。3.学会解析响应与错误处理:提取有效信息、处理异常情况。4.进阶参数调优与场景定制:通过system提示和生成参数优化结果。
2025-07-23 17:05:28
105
Java自实现Socket服务
2014-11-19
Hadoop rpc源码
2014-11-21
eclipse 的propedit插件
2009-09-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅