考研复试-前沿技术+软工+数据库速成

一、前沿技术

·大数据

1.什么是数据挖掘
数据挖掘是人工智能和数据库领域研究的热点问题,数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。

2.什么是大数据?你接触到的最大的数据有多大?
大数据是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

3.大数据的特点?
1.Volume:数据量巨大
体量大是大数据区分于传统数据最显著的特征。一般关系型数据库处理的数据量在TB级,大数据所处理的数据量通常在PB级以上。
2.Variety:数据类型多
大数据所处理的计算机数据类型早已不是单一的文本形式或者结构化数据库中的表,它包括订单、日志、BLOG、微博、音频、视频等各种复杂结构的数据。
3.Velocity:数据流动快
速度是大数据区分于传统数据的重要特征。在海量数据面前,需要实时分析获取需要的信息,处理数据的效率就是组织的生命。
4.Value:数据潜在价值大
在研究和技术开发领域,上述三个特征已经足够表征大数据的特点。但在商业应用领域,第四个特征就显得非常关键!投入如此巨大的研究和技术开发的努力,就是因为大家
都洞察到了大数据的潜在巨大价值。如何通过强大的机器学习和高级分析更迅速地完成数据的价值“提纯”,挖掘出大数据的潜在价值,这是目前大数据应用背景下苛待解决的难题。

4.大数据发展的瓶颈?
没有成熟的方法采集和处理大数据。
数据涉及到隐私,法律法规还没有完善。
大量不同类别的数据不知道怎么存储。
数据的独占性:有价值的数据别人不一定会分享。

5.大数据和数据挖掘有什么区别?举例生活中的大数据和数据挖掘的例子
大数据是指用现有的计算机软硬件设施难以采集、存储、管理、分析和使用的超大规模的数据集。而数据挖掘是指通过大数据集查找相关有价值的信息的活动。大数据是资产,数据挖掘是用于提供有益结果的处理程序。
例子:
1在电商平台上购物,系统会给你推荐某些的商品,依据就是用户数据分析。
2今日头条之类的应用,推送的内容就是利用大数据和人工智能技术实现。
2.某些平台使用的智能客服机器人,就是利用大数据,借助深度学习训练出来的。
3…网易云音乐之类的产品,通过大数据分析给用户推荐歌曲、歌单。

·机器学习

1.什么是机器学习?讲讲具体的算法。你认为你本科学的数学有哪些会用到机器学习中?
机器学习是一门多学科交叉专业,涵盖概率论知识,统计学知识和复杂算法知识,使用计算机作为工具并致力于模拟人类的学习方式,并将现有内容进行知识结构划分来有效提高学习效率。

2.什么是神经网络?
神经网络,它是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。这种网络依靠系统的复杂程度,通过调整内部大量节点之间相互连接的关系,从而达到处理信息的目的。

3.什么是深度学习?
深度学习(DL)是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字,图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。 深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果,远远超过先前相关技术。
深度学习在搜索技术,数据挖掘,机器学习,机器翻译,自然语言处理,多媒体学习,语音,推荐和个性化技术,以及其他相关领域都取得了很多成果。深度学习使机器模仿视听和思考等人类的活动,解决了很多复杂的模式识别难题,使得人工智能相关技术取得了很大进步。

·其他

1.什么是人工智能,谈谈你对她的理解?
人工智能(Artificial Intelligence),AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。
人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能是包括十分广泛的科学,它由不同的领域组成,如机器学习,计算机视觉等等,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。
(简略:人工智能系统以模拟神经元组成的神经网络算法为基础 ,通过数据挖掘和概率总结进行深度的学习、记忆和运算。并在硬件支持下利用算法进行交互学习和提升,不断提高预测和决策的能力)
2.用过哪些搜索引擎,他们的区别是什么
谷歌的优点:信息量广和百度比较能更有效的找到准确的信息而且广告少缺点:链接不能及时更新中文网站检索查找效率不高网站快照漏洞大。
百度的优点:百度的使用者标准低能广泛适用于任何人操作难度低
缺点:信息准确率低广告多商业的信息多目标信息不准确。
搜狗的优点:独立网站查找方便分类化查询缺点:内容更新慢信息量少

3.你认为的计算机发展前景,那些方面比较热门

4.什么是嵌入式系统
嵌入式系统由硬件和软件组成.是能够独立进行运作的器件。其软件内容只包括软件运行环境及其操作系统。硬件内容包括信号处理器、存储器、通信模块等在内的多方面的内容。相比于一般的计算机处理系统而言,嵌入式系统不能实现大容量的存储功能,因为没有与之相匹配的大容量介质, 软件部分以API编程接口作为开发平台的核心

5.云计算?
云计算是一种按使用量付费的模式,这种模式提供可用的、便捷的、按需的网络访问, 进入可配置的计算资源共享池,这些资源能够被快速提供,只需投入很少的管理工作,或与服务供应商进行很少的交互。
云计算是分布式计算的一种,指的是通过网络“云”将巨大的数据计算处理程序分解成无数个小程序,然后,通过多部服务器组成的系统进行处理和分析这些小程序得到结果并整合返回给用户。通过这项技术,可以在很短的时间内完成对数以万计的数据的处理,从而达到强大的网络服务。

6.计算机视觉
计算机视觉是深度学习领域最热门的研究领域之一。计算机视觉:使用计算机模拟人的大脑视觉机理获取和处理信息的能力,例如进行图像目标的检测、识别、跟踪等任务。计算机视觉也是跨领域交叉学科,包括了统计学、计算机科学、数学,工程学,生物学等学科,最终的目标就是实现计算机对三维现实世界的理解,实现人类视觉系统的功能。更抽象的,计算机视觉可以是看作在图像等高维数据中的感知问题,包含了,模式识别,图像处理和图像理解等。
计算机视觉有实际的应用,例如:人脸识别,如手机的人脸解锁,支付软件的人脸识别支付
图像检索:Google 使用基于内容的查询来搜索相关图片,算法分析查询图像中的内容并根据最佳匹配内容返回结果。
监测:各大公共场所中使用监视摄像头监测可疑行为。
生物识别技术:指纹、虹膜和人脸匹配
计算机视觉五大技术
图像分类,对象检测,目标跟踪,语义分割,实例分割
这5 种主要的计算机视觉技术可以协助计算机从单个或一系列图像中提取、分析和理解有用的信息。

7.谈谈你对区块链的理解
区块链,因比特币而生。交易数据放到区块中,并把其hash值存储到区块头当中。每个区块的hash值自动带入下一个区块,不仅存放在下一区块头中,还参与下一个区块的hash计算。这样一来,一个区块自然地与下一个区块通过hash值和hash运算绑定在一起,形成一个链式结构,即所谓的区块链。区块链技术在去中心化、各节点无需事先信任的情况下,通过加密算法、共识机制和特定的数据存储方式构建一个集体维护的可靠的数据模式,实现数字资产在网络节点之间的转移。区块链技术不光可用于比特币,还可以用于其它需要保护完整性的各种场合,像金融服务,资源共享,物联网与供应链等。比如说,区块链技术可以应用到食品产业链中,它所具备的数据不可篡改性和可追溯性,一方面能够确保食品在生产及销售的过程中信息不被篡改,另一方面可以确保商家在食品生产的过程中不会造假。运用区块链技术保证食品在生产、运输、经销等方面信息数据的公开化、共享化,从而解决食品安全问题

二、数据库原理

1.什么是存储过程
存储过程是在大型数据库系统中,一组为了完成特定功能的SQL 语句集,它存储在数据库中,一次编译后永久有效,用户通过指定存储过程的名字并给出参数(如果该存储过程带有参数)来执行它。

2.数据库索引
索引是对数据库表中一列或多列的值进行排序的一种结构,使用索引可快速访问数据库表中的特定信息。
索引并不是越多越好,索引固然可以提高相应的 SELECT 的效率,但同时也降低了 INSERT 及 UPDATE 的效率,因为 INSERT 或 UPDATE 时有可能会重建索引。

3.数据库视图及其优点
视图是从一个或几个基本表(或视图)中导出的虚拟的表。在系统的数据字典中仅存放了视图的定义,不存放视图对应的数据。
优点:
(1) 简化了操作,把经常使用的数据定义为视图。
(2) 安全性,用户只能查询和修改能看到的数据。
(3) 逻辑上的独立性,屏蔽了真实表的结构带来的影响。

4.主属性与非主属性的区别
若关系中的一个属性或属性组的值能够唯一地标识一个元组,且他的真子集不能唯一的标识一个元组,则称这个属性或属性组做候选码。在一个关系中,如果一个属性是构成某一个候选关键字(候选码)的属性集中的一个属性,则称它为主属性。不包含在任何一个候选码中的属性称为非主属性。

5.完整性,独立性
数据库完整性是指数据库中数据的正确性和相容性。
数据独立性是指应用程序和数据结构之间相互独立, 互不影响。

6.数据库五层范式
第一范式(1NF)、第二范式(2NF) 、第三范式(3NF)、BC范式(BCNF)、第四范式(4NF)

7.事务
数据库事务是访问并可能操作各种数据项的一个数据库操作序列,这些操作要么全部执行,要么全部不执行,是一个不可分割的工作单位。事务由事务开始与事务结束之间执行的全部数据库操作组成。

8.多用join操作好不好
遇到数据量大的表,join查询是非常损耗性能的,甚至导致数据库连接超时、挂掉等问题。

9.触发器
触发器一般有两种,一种是AFTER触发器,一种是INSTEAD OF触发器。after触发器是在某一类操作结束之后,触发器才会触发,而instead of触发器将替换某一类操作。

10.左连接和右连接的区别
左连接: 包含左边表的全部行(不管右边的表中是否存在与它们匹配的行),以及右边表中全部匹配的行
右连接: 包含右边表的全部行(不管左边的表中是否存在与它们匹配的行),以及左边表中全部匹配的行

11.在数据库表中加入冗余字段破坏了第几范式?为什么破坏了范式还是要加入冗余字段?
破坏了第三范式。
考虑性能:以空间换时间,在数据库的实践过程中,我们可能遇到数据量非常大的数据表,这时候去做join查询是非常损耗性能的,甚至导致数据库连接超时、挂掉等问题。所以有时候就需要数据库做冗余设计ÿ

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值