人工智能
道法—自然
不积跬步,无以至千里;不积小流,无以成江海。——荀子
展开
-
北邮软工硕士复试笔试科目
北京邮电大学计算机科学与技术专业硕士研究生复试参考书目:《编译原理与技术》、《计算机系统结构》、《数据库系统原理》、《软件工程》、《通信原理》、《人工智能》六门选四门;一、《编译原理与技术》:1、编译程序设计原理与技术 李文生 北京邮电大学出版社。2、编译原理(第2版)张素琴等,清华大学出版社。3、现代编译原理C语言描述 AndrewW.Appel著,赵克佳等译。二、《计算机系统结构》:1、《计算机体系结构》郑纬民、汤志忠清华大学出版社2001年。2、《并行计算机系统结构(第原创 2020-08-21 23:41:16 · 4776 阅读 · 0 评论 -
语音合成中的特殊读法
特殊读法:1、演示涉及语音识别出现白字的问题2、演示需要的意图配置“发现东大I路”,在播报的时候念得是i不是I,需要优先处理将“发现东大I路”错播成了“发现东大爱路”将“#1”跳过了“#”,将“1”错误念成了“yao”,而“#1”应该念成“1号”相应地:“#0——#9”号相应地应该念成“0号”、“1号”。。9号需要单独列出来的:scada si(斯) ga(嘎) da(搭) oms ou(欧) mi(米) si(斯)oms念成“O”、“M”、“S”也可以如果是物理值,需要念成100为.原创 2020-07-02 15:45:39 · 445 阅读 · 0 评论 -
语音播报中的特殊处理
语音播报参观讲解1、语音播报中途停止(打断)2、语音播报柔和,有感情,具体解决办法:①标点符号停顿(,。:!;?、)②调整语速(提供接口,底层有默认的值,可以修改)③语音播报增加声调调(评估、尽量能实现)3、特殊读法的处理①特殊读法:kV(必须是:k小写,V大写,读千伏)②相(四声):在和A,B,C一起出现时,三相、单相、两相、相电流、相电压、相间电流(电力系统语境)、相间电压(电力系统语境下)读 四声;③小数点(.),当前后全部为数字的时候,读成dian(1.57),当前后是汉字的时候.原创 2020-07-02 15:42:22 · 454 阅读 · 0 评论 -
基本积分公式
原创 2020-06-25 17:41:31 · 897 阅读 · 0 评论 -
Python及机器学习资料
@所有人欢迎新加入的小伙伴~~掌声~【两个微信群】- 问题讨论群:用于问具体代码或者算法问题- 吹水聊天群:用于聊周边【视频资料】资料下载链接:http://47.240.55.52/index.php/s/KKi2NjXAYNNLo5b【学习路径】供参考https://www.bilibili.com/video/BV1JE411x7Lf【秩序维护】富强民主文明和谐哈违反者没有警告直接抱出~一定注意啊【新建的QQ群】PYTHON冲冲冲-6:52603238原创 2020-06-21 22:09:06 · 221 阅读 · 1 评论 -
物联网应用层协议
物联网连接的七层协议如上图所示,从下往上分别是:物理层、数据链路层、网络层、传输层、会话层、表示层、应用层。应用层网络协议(DHCP)是一种使网络治理员能够中心治理和自动分配IP网络地址的通信协议。IP网络中,每件连接Internet的设备都需要分配唯一的IP地址。重点介绍应用层协议:(1)域名系统(Domain Name System,DNS):用于实现网络设备名字到IP地址映射的网络服务。(2)文件传输协议(File Transfer Protocol,FTP):用于实现交互式文件传..原创 2020-06-21 09:28:44 · 2335 阅读 · 0 评论 -
ZigBee、WiFi、蓝牙的区别
原文连接 目录 ZigBee、WiFi、蓝牙等常用2.4Ghz无线技术的区别 ZigBee引领物联网设备大步向前 ZigBee引领物联网设备大步向前 WiFi后浪拍前浪 蓝牙全新升级,深入日常应用现在无线通读热了起来。三个最大的Wifi、ZigBee、蓝牙它们三个始终困惑着我。那么它们三个有什么区别呢? Zigbee 和蓝牙都是一项无线通信技术。ZigBee的传输距离视发射功率而定,有几百到几千米不等,不过传输率却只有250kps的,但是这个只是理论值。一般也就原创 2020-06-21 00:31:37 · 7252 阅读 · 0 评论 -
人工智能的发展原理
深度学习的参数越多,结果就会越精准。原创 2020-06-20 22:53:38 · 541 阅读 · 0 评论 -
语音识别工程师所需要掌握的技术
语音识别工程师所需要掌握的技术:1、信号处理:①声源追踪;②声源分析;③声源定位;④混响抑制;⑤波束形成;⑥回声抵消;⑦语音增强;⑧噪声抑制;2、算法:①端点检测;②语言模型;③解码搜索;④特征提取;⑤声学机理;1)发音机理;2)听觉机理;3)语言机理;⑥神学模型;1)RNN;2)CNN;3)DNN;4)HNN;5)GMM;3、开源库:①TensortFlow;②HTK;③Kaldl;④I..原创 2020-06-20 17:36:59 · 1885 阅读 · 0 评论 -
人工智能人才需要掌握的知识
1、数学基础:①概率论;②线性代数;③微积分;④凸优化;⑤统计机器学习;2、理论入门:①神经元 模型;②激活函数;③损失函数;④训练方法;⑤梯度的消失溢出;3、计算机基础:①Python;②C++;③Linux系统;④shell;⑤CUDA;⑥分布式计算;4、实战入门:①掌握深度学习框架;②研读代码;③复现Benchmark改进方法;5、进阶经验:①充足的数据;②熟练的编程实现能力;③充裕的GPU资源..原创 2020-06-20 17:01:12 · 472 阅读 · 0 评论 -
人工智能的细分领域
人工智能的细分领域包括:1、语音识别及语音合成;2、自然语言处理;3、知识图谱;4、计算机视觉、图像识别、图像处理;5、高性能并行计算;6、数据分析、数据挖掘;7、机器学习、深度学习算法;...原创 2020-06-20 16:43:03 · 3132 阅读 · 0 评论 -
语音识别的流程
原创 2020-06-10 16:35:13 · 741 阅读 · 0 评论 -
大数据的5V特征
IBM提出了大数据”5V”特点:一、Volume:数据量大,包括采集、存储和计算的量都非常大。大数据的起始计量单位至少是P(1000个T)、E(100万个T)或Z(10亿个T)。二、Variety:种类和来源多样化。包括结构化、半结构化和非结构化数据,具体表现为网络日志、音频、视频、图片、地理位置信息等等,多类型的数据对数据的处理能力提出了更高的要求。三、Value:数据价值密度相对较低,或者说是浪里淘沙却又弥足珍贵。随着互联网以及物联网的广泛应用,信息感知无处不在,信息海量,但价值密度较低,如原创 2020-06-08 23:08:23 · 29442 阅读 · 0 评论 -
线性回归
原创 2020-06-07 19:22:46 · 128 阅读 · 0 评论 -
有监督机器学习
原创 2020-06-07 10:24:40 · 247 阅读 · 0 评论 -
语音识别语言模型介绍
语言模型技术广泛应用于语音识别、OCR、机器翻译、输入法等产品上。语言模型建模过程中,包括词典、语料、模型选择,对产品的性能有至关重要的影响。语言模型的建模需要利用复杂的模型公式进行模拟计算,是人工智能领域的关键技术之一。1.语言模型的背景语言模型是针对某种语言建立的概率模型,目的是建立一个能够描述给定词序列在语言中的出现的概率的分布。给定下边两句话:定义机器人时代的大脑引擎,让生活更便捷、更有趣、更安全。代时人机器定义引擎的大脑,生活让更便捷,有趣更,安更全。语言模型会告诉你,第一句.原创 2020-06-07 01:09:23 · 4335 阅读 · 0 评论 -
语音识别声学模型介绍
关于声学模型,主要有两个问题,分别是特征向量序列的可变长和音频信号的丰富变化性。可变长特征向量序列问题在学术上通常有动态时间规划(Dynamic Time Warping, DTW)和隐马尔科夫模型(Hidden Markov Model, HMM)方法来解决。而音频信号的丰富变化性是由说话人的各种复杂特性或者说话风格与语速、环境噪声、信道干扰、方言差异等因素引起的。声学模型需要足够的鲁棒性来处理以上的情况。在过去,主流的语音识别系统通常使用梅尔倒谱系数(Mel-Frequency Cepstral C原创 2020-06-07 01:00:13 · 4251 阅读 · 0 评论 -
19种音频格式介绍及音质压缩比的比较
1.前言在日常生活中,我们会听各种音乐,而这些音乐大多数都是以数码的形式传播的,无论是在电脑上试听或下载还是在MP3或CD机上试听。当然也会经常看到各式各类的诸如MP3、WMV、APE等格式,但你是否明白这些格式的意思呢?下面小编就为你整理了一些这方面的内容,希望能有帮助。1.1数码音乐简介数字音源,也就是数字音频格式,最早指的是CD,CD经过压缩之后,又衍生出多种适于在随身听上播放的格式,这些压缩过的格式,我们可以分为两大类:有损压缩的和无损压缩的。这里所说的压缩,是指把PCM编码的或者是WA原创 2020-06-07 00:08:58 · 20793 阅读 · 1 评论 -
封装语音模型的服务简介
无论是语音识别模型、声纹识别模型、语音合成模型等,最初始均是从算法中提取出来的模型,需要使用服务将其封装之后,做成成熟的服务,写成完整的接口文档、样例代码、文字说明等完整地SDK,提供给业务人员去调用。在该过程汇总书写成封装语音模型并对外提供调用接口的服务非常关键,该服务最终是否要和语音识别模型部署在同一台服务器上,具体如何部署,这些都很关键。目前主流封账了模型并对外开放调用接口的服务有很多种方式,有Apache、Tomcat、nginx、ISS等。下边说明一下其优缺点: 序号原创 2020-06-05 00:50:57 · 257 阅读 · 0 评论 -
HTTP协议chunk编码介绍
当客户端向服务器请求一个静态页面或者一张图片时,服务器可以很清楚的知道内容大小,然后通过Content-Length消息首部字段告诉客户端需要接收多少数据。但是如果是动态页面等时,服务器是不可能预先知道内容大小,这时就可以使用Transfer-Encoding:chunk模式来传输数据了。即如果要一边产生数据,一边发给客户端,服务器就需要使用"Transfer-Encoding: chunked"这样的方式来代替Content-Length。在进行chunked编码传输时,在回复消息的头部有Transf原创 2020-06-04 22:28:16 · 800 阅读 · 0 评论 -
浏览器背景介绍
由于PC时代的到来,语音在PC端使用的比较多。PC端使用语音采集音频有两种方式,分别是浏览器采音传输到云端去识别并返回结果展示,与PC机器本地启动插件程序,用户对着麦克风说话,麦克风阵列采集到声卡传送过来的音频,送到云端去识别。首先介绍浏览器端的采音。浏览器是网页显示、运行的平台,当然有一部分浏览器能够支持网页端采集音频文件功能。常用的浏览器有IE、火狐(Firefox)、谷歌(Chrome)、Safari和Opera等。我们平时称为五大浏览器。当然还有其他浏览器:QQ浏览器、百度浏览器、搜狗浏览器、猎原创 2020-06-04 17:37:19 · 580 阅读 · 0 评论 -
五大主流浏览器
在介绍浏览器内核之前,我们先从我们熟悉的五大主流浏览器入手,逐步深入地理解四大浏览器内核。五大主流浏览器(按照诞生顺序介绍):IE浏览器IE是微软公司旗下浏览器,是目国内用户量最多的浏览器。IE诞生于1994年,当时微软为了对抗市场份额占据将近百分之九十的网景Netscape Navigator,于是在Windows中开发了自己的浏览器Internet Explorer,自此也引发了第一次浏览器大战。结果微软大获全胜,网景将自己卖给AOL公司。从此之后,网景团队开始开发另外一款浏览器——Firefox原创 2020-06-04 17:36:33 · 871 阅读 · 0 评论 -
四大浏览器内核介绍
浏览器内核”主要指渲染引擎(Rendering Engine),负责解析网页语法(如HTML、JavaScript)并渲染、展示网页。因此,所谓的浏览器内核通常也就是指浏览器所采用的渲染引擎, 渲染引擎决定了浏览器如何显示网页的内容以及页面的格式信息。不同的浏览器内核对网页编写语法的解析也有所不同,因此同一网页在不同的内核浏览器里的渲 染、展示效果也可能不同。 浏览器内核种类繁多,商用的加上非商业的免费内核,大约会超过10款,我们今天重点看一下目前主流的四大浏览器内核Trident、Gecko、Web原创 2020-06-04 17:35:14 · 424 阅读 · 0 评论 -
边缘计算与云计算协同产业白皮书
边缘计算与云计算协同产业白皮书原创 2020-06-02 23:47:21 · 228 阅读 · 0 评论