大数据基础概念
介绍大数据的理论性概念
城南皮卡丘
擅长Java全栈、Python开发、深度学习与神经网络等,研究方向为CV、NLP
展开
-
大数据基础--行业大数据
1.简述密集地震观测网的组成。 地震烈度速报系统、地震预警系统、MEMS传感器烈度仪和智能设备。2.如何从地震大数据中找出关联性。 不拘泥于对因果关系的研究,向关联、非关联等相关关系探究转变。按照大数据的方式,不管这些数据的手段和学科,也不管它的空间维度和结构,只要出现异常就代入异常度公式计算。3.简述对异常活动的剧烈程度的参量公式的理解。 我们定义“异常活动度”为...转载 2020-03-20 14:37:18 · 244 阅读 · 0 评论 -
大数据基础--大数据商业应用
1.简述对用户画像的认识。 用户画像,即用户信息的标签化,是企业通过收集、分析用户数据后,抽象出的一个虚拟用户,可以认为是真实用户的虚拟代表。2.简述构建用户画像的主要流程。 基础数据收集->行为建模->构建画像 3.个性化推荐系统的性能可以通过哪些标准来判定? 用户满意度 覆...转载 2020-03-18 17:24:24 · 540 阅读 · 0 评论 -
机器学习理论基础--常用算法思想要点
目录一、什么是机器学习?简述机器学习的一般过程。二、简述 K 折交叉验证与留一法的基本思想及其特点。三、简述什么是欠拟合和过拟合、产生的原因以及如何解决。四、简述线性回归与逻辑回归的区别。五、简述剪枝的目的以及常用的两种剪枝方式的基本过程。六、简述K均值聚类算法的流程。七、简述什么是降维以及PCA算法的流程。八、简述贝叶斯网的组成,贝叶斯网中结点的三种...转载 2020-03-18 17:19:14 · 1339 阅读 · 0 评论 -
互联网大数据处理
1.简述互联网信息抓取的方式。 互联网信息自动抓取,最常见且有效的方式是使用网络爬虫。2.简述舆情系统的组成架构。 用户终端->采集层->分析层->呈现层->用户 3.中文分词算法可以分为哪几类? (1)基于字符串匹配的分词方法,它是待处理的中文字符...转载 2020-03-18 17:09:06 · 387 阅读 · 0 评论 -
数据可视化
目录1.数据可视化有哪些基本特征?2.简述可视化技术支持计算机辅助数据认识的3个基本阶段。3.数据可视化对数据的综合运用有哪几个步骤?4.简述数据可视化的应用。5.简述文本可视化的意义。6.网络(图)可视化有哪些主要形式?7.多数据可视化主要应用在哪种场景?8.大数据可视化软件和工具有哪些?1.数据可视化有哪些基本特征? (1)易懂性,可视化可以使...转载 2020-03-18 16:56:00 · 2365 阅读 · 0 评论 -
大数据基础--深度学习
目录1.简述人工神经网络定义。2.简述神经网络架构。3.简述误差逆传播算法。4.大数据与深度学习之间有什么样的关系?5.简述人工智能的未来发展。6.目前影响力比较大的深度学习模型有哪些?7.自动编码器主要有哪两种变体?8.卷积神经网络主要有哪些特点?9.降采样操作常用的类型有哪些?10.简述循环神经网络的架构。11.分别简述CNTK、MXNet、T...转载 2020-03-18 16:51:04 · 1021 阅读 · 0 评论 -
大数据基础--R语言
目录1.R语言是解释性语言还是编译性语言?2.简述R语言的基本功能。3.R语言通常用在哪些领域?4.R语言常用的分类和预测算法有哪些?5.简述如何利用R程序包进行数据分析、建模和数据预测。6.如何使用“聚类”和“分类”对数据样本进行分组。7.SparkR DataFrame的作用有哪些?8.简述SparkR与机器学习的关系。1.R语言是解释性语言还是编译性...转载 2020-03-18 16:47:15 · 749 阅读 · 0 评论 -
大数据挖掘工具
目录1.简述常用机器学习系统和大数据挖掘工具有哪些2.Mahout的适用场合与特点有哪些?3.Spark MLlib的适用场合和特点有哪些?4.简述SystemML的体系结构5.简述Parameter Server的工作原理6.简述Scikit-Learn的主要模块。7.简述Weka的工作原理。8.基于R语言的机器学习库有哪些?9.简述H2O机器学习系统的...转载 2020-03-18 15:57:50 · 763 阅读 · 0 评论 -
数据挖掘算法
目录1.简述数据挖掘概念。2.根据预测方法的性质将预测方法分为哪些类?各有何优缺点?3.时序预测方面典型的算法有哪些?各有什么特点?4.根据研究的方式分类,可将时间序列预测与挖掘分为哪些类? 5.什么是序贯模式挖掘SPMGC算法?6.数据挖掘的常用算法有哪几类?有哪些主要算法?7.数据挖掘方法中分类的含义?分类与聚类方法的区别? 8.时间序列预测方法分哪几...转载 2020-03-18 15:42:41 · 2836 阅读 · 0 评论 -
数据采集与预处理
目录1.采用哪些方式可以获取大数据?2.常用大数据采集工具有哪些?3.简述什么是Apache Kafka数据采集。4.Topic可以有多少个分区,这些分区有什么用?5.Kafka抽象具有哪种模式的特征消费组?6.简述数据预处理的原理。7.数据清洗有哪些方法?8.数据集成需要重点考虑的问题有哪些?9.数据变换主要涉及哪些内容?10.分别简述常用ETL工具...转载 2020-03-18 15:19:25 · 5011 阅读 · 0 评论 -
大数据概念与应用
目录1.新摩尔定律的含义是?2.大数据现象是怎么形成的?3.大数据有哪些特征?4.如何对大数据的来源进行分类?5.常用大数据获取的途径 6.大数据处理方法有哪些?7.大数据预处理的方法有哪些?8.大数据的挖掘方法有哪些?9.大数据应用场景1.新摩尔定律的含义是? Jim Gray提著名的“新摩尔定律”,即人类有史以来的数据总量,每过18个月翻一番...转载 2020-03-18 15:01:39 · 987 阅读 · 0 评论