![](https://img-blog.csdnimg.cn/20201014180756925.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
大数据
文章平均质量分 85
DataHub数据社区
DataHub数据社区联合创始人。专注数据管理、AI、泛数字化。公众号:Data200
展开
-
机器学习导论
而如今的商业搜索引擎更多地采用基于机器学习的排名系统,通过挖掘超大规模的查询日志,构建涵盖上下文、语义、用户行为的特征工程,并使用 LambdaRank、RankNet等学习到排序模型,为用户提供更加智能和个性化的搜索结果排名。近年来,通过增加网络深度、设计新的网络结构和训练技巧(如Dropout),深度神经网络(DNN)展现出了极强的机器学习能力,在计算机视觉、语音识别、自然语言处理等多个领域取得了突破性进展,推动了人工智能的发展。如何规范人工智能的发展,平衡利弊,仍是一个严峻的课题。原创 2024-03-31 11:23:13 · 486 阅读 · 1 评论 -
现代数据采集解决方案指南
数据采集作为大数据生命周期中最为基础和关键的第一环节,其核心目标是从各种异构数据源高效、可靠地收集所需数据,为后续的数据处理和数据分析等环节提供优质的数据输入。在当前的数字化时代,随着信息技术的飞速发展和深入渗透应用,各行各业所产生的数据量正呈现出前所未有的爆炸式增长态势。与此同时,数据的种类和形式也变得越来越多样化和复杂,不仅包括传统的结构化数据(如关系型数据库中的表格数据)、半结构化数据(如XML、JSON等标记语言或非固定模式数据),更有大量的非结构化数据(如文本、图片、音频、视频、地理位置数据等多媒原创 2024-03-30 11:55:45 · 1191 阅读 · 1 评论 -
数据架构与模型管理
广义上来说,数据架构描述了数据的结构、关系、流转路径等,规范了如何捕获、存储、管理和传递数据。有效的数据架构不仅能确保数据的完整性、准确性和可靠性,更重要的是能最大化数据资产的价值,实现数据在整个企业范围内的共享和重用。数据架构师需要具备全局观、创新精神和技术创新力,才能应对日新月异的挑战,打造灵活、智能、统一的现代数据架构。数据湖旨在建立统一的数据平台,以高效便捷的方式存储任何形式的数据,为分析和数据科学应用提供支持。它不仅确保应用程序处理数据的正确性,更重要的是支持跨系统、跨部门的数据集成和共享。原创 2024-03-30 11:15:12 · 888 阅读 · 0 评论 -
2024年数据库选型指南
本章将分别介绍关系型数据库、NoSQL数据库、NewSQL数据库、内存数据库和时序数据库等领域的主流数据库产品,并分析其适用场景、优缺点等。原创 2024-03-25 11:09:51 · 798 阅读 · 1 评论