![](https://img-blog.csdnimg.cn/20201014180756916.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
论文
文章平均质量分 90
我一拳打弯你A柱
7200 干他!
展开
-
【翻译】A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with Noise
【翻译】A Density-Based Algorithm for Discovering Clusters in Large Spatial Databases with NoiseAbstract 摘要 聚类算法是空间数据库分类识别的一种有效方法。然而,在大型空间数据库中的应用对聚类算法提出了如下要求:以最小的领域知识要求来确定输入参数,发现任意形状的聚类,在大型数据库上具有良好的效率。众所周知的聚类算法无法解决这些需求的结合。本文提出了一种新的基于聚类密度的聚类算法DBSCAN,该算法旨在发现原创 2021-04-14 11:41:30 · 1180 阅读 · 0 评论 -
【翻译】ASML Automatic Streaming Machine Learning
【翻译】ASML Automatic Streaming Machine Learning摘要 Abstract 除了大数据系统的规模问题,新数据产生和移动的高速度也带来了新的挑战。为了提取有用的见解,构建能够高效处理高速数据的系统变得至关重要,如果处理大数据而无法从中获得价值则并没有什么意义。 与典型的离线/批处理机器学习场景相反,在流的设置中,数据无法预先访问,我们需要在流数据到达时即刻学习并预测,从而支持实时的决策,例如基于他/她的概率会点击决定是否向用户展示一个广告。 在这项工作原创 2021-04-08 11:24:12 · 376 阅读 · 0 评论 -
【翻译】StreamDM:基于Spark Streaming的高级数据挖掘 StreamDM: Advanced Data Mining in Spark Streaming
【翻译】StreamDM:基于Spark Streaming的高级数据挖掘 StreamDM: Advanced Data Mining in Spark Streaming摘要 Abstract 由于不断产生的大量数据,实时分析变得越来越重要。根据我们在华为诺亚方舟实验室的经验,我们在这里展示并演示了StreamDM,这是一个新的开源数据挖掘和机器学习库,设计在Spark Streaming之上,Spark Streaming是Spark核心API的扩展,支持可扩展的数据流处理。StreamDM原创 2021-04-05 11:17:27 · 535 阅读 · 1 评论 -
【翻译】Big Data Analysis: Apache Storm Perspective 大数据分析:Apache Storm视角
【翻译】Big Data Analysis: Apache Storm Perspective 大数据分析:Apache Storm视角摘要 Abstract技术的繁荣导致了新概念和新挑战的出现。大数据是当今人们谈论的术语之一。在商业竞争中,大数据正成为竞争优势的同义词。尽管大数据带来了巨大的好处,但也伴随着一些严峻的挑战,当涉及到大数据分析时,它需要一些严肃的思考。在业界最受信任的实时处理和容错工具Apache Storm的帮助下,本研究利用Twitter数据样本,探索大数据术语及其分析概念。关键原创 2021-04-02 09:42:10 · 523 阅读 · 2 评论 -
【翻译】MOA - Massive Online Analysis, a Framework for Stream Classification and Clustering
【翻译】MOA - Massive Online Analysis, a Framework for Stream Classification and Clustering. MOA - 海量在线分析,一个流分类聚类框架摘要 Abstract 海量在线分析(MOA)是一个软件环境,可以用于实现算法和运行实验,从不断演变的数据流中进行在线学习。MOA的设计是为了解决将最先进算法的实现扩展到真实世界数据集大小的挑战性问题。它包含了用于分类和聚类的离线在线集合,以及用于评估的工具。特别的,对于分类,它实原创 2021-04-01 10:25:59 · 1100 阅读 · 3 评论 -
【翻译 - 部分】CluStream - 用于聚类不断演变的数据流的框架
CluStream - 用于聚类不断演变的数据流的框架摘要 Abstract 聚类问题是流式数据领域的一个难题。这是因为大规模的数据流的到达使得传统算法显得效率太低。近几年,一些逐条聚类的算法被发明出来应对流式数据的问题。尽管这些方法解决了聚类问题中的可伸缩性问题,但是他们对数据的演变视而不见,并且无法解决以下问题:(1)当数据随着时间的推移发展时,簇的质量会很差。(2)一个流式数据聚类算法面对不同部分的数据流时需要更强大的发现和探索簇心的功能。 面对流式数据聚类算法广泛的做法是一类将数据逐条原创 2021-03-29 23:28:42 · 619 阅读 · 0 评论 -
浅谈人工智能时代下的工程伦理问题
浅谈人工智能时代下的工程伦理问题一、引言近年来,随着大数据基础设施建设以及人工智能技术的发展,社会中涌现出许多新技术,给人们带来更便捷的生活。但与其共生的道德风险问题也日益显著。人工智能道德风险即人工智能技术带来的伦理结果的不确定性,其既有主观因素也有客观因素,具体表现有道德算法风险、道德决策风险、隐私数据泄露风险等。风险主要成因有技术主体、政治、经济、文化等社会因素。结合当下大数据驱动的人工智能算法特点,如何运用风险治理思想分析其背后的工程伦理问题对人工智能领域发展具有重要意义。二、人工智能时代的当原创 2021-01-09 23:29:25 · 80000 阅读 · 97 评论 -
Online Internet Traffic Monitoring System Using Spark Streaming 基于Spark Streaming的在线网络交通监管系统
基于Spark Streaming的在线网络交通监管系统摘要 由于爆炸增长的网络流量数据,网络管理者必须能够监管整个网络的状况并高效地管理网络资源。传统的网络分析方法通常是单机执行,而这种方式因其较差的计算能力不再适用于大规模的流量数据。大数据框架例如Hadoop和Spark可以处理大规模的网络数据。然而,Hadoop和Spark本是为离线数据而设计的。为了应对流式数据,许多流处理框架被提出,例如Storm,Flink和Spark Streaming。在这篇论文的研究中,我们基于Spark Stre原创 2021-02-17 14:29:09 · 360 阅读 · 1 评论