• 博客(14)
  • 收藏
  • 关注

转载 不用手机,如何让猫给你打视频电话 | 日常小技

文章首发于微信公众号@代号XY作者:代号XY大家好,我是XY。「日常小技」栏目是我和RZ做项目时发现的一些内行小技术,可以应用在日常生活中。未来我们会把积累写的相关程序开源。① 首先,你需要一个摄像头某宝上平均售价从20、200到400元不等就像选相机一样,像素、帧率是硬指标。这是你可以重复利用的东西,拆装很方便。② 你还需要一个麦克风、一对或一个扬声器,接口有USB、电线或是传统音频接口的可选。③ 但是有点遗憾的是,要让????打电话,没有ta的必然,只有“偶然”。当然

2021-08-31 14:35:09 271

原创 漫游语音识别技术——带你走进语音识别技术的世界

前有古人,后有小王,大家好,我是你们爱思考的小王学长,今天我来带大家漫游一下当下发展火热的语音识别技术,通俗易懂、干货满满、一定要学到最后呦!一看到语音识别,不知道大家有没有想到智能语音交互助手,苹果的“Siri”、华为的“小 E”、OPPO 的“小欧”、小米的“小爱同学”,总有一款你接触过,还有目前发展火热的智能音箱“小度小度”、天猫精灵、微信的“语音转文字功能”、“智能家电”、车联网人机交互系统,这些都是依靠语音识别技术来实现的。应用场景平时我们用的电脑大都是微软的 windows 系列,其.

2021-08-30 20:19:40 495

原创 笔记分享 -- 弱网下的极限实时视频通信

今天给大家分享一下 InfoQ 平台公开课——弱网下的极限实时视频通信,关于实时视频通信的极限探索,主讲人是南京大学的马展教授。一、课题背景首先说下课题的背景,平时手机、电脑等网络设备接收信息的准确性和及时性都与实时通信有关,以实时视频通信为例,我们不可能一直保证网络的全时稳定,此时,弱网环境的存在会对提高传输质量起到重要的作用。引用官方的解释就是:弱网环境长期存在,特别在很多关乎到生活、生产乃至生命的关键时刻,通信网络往往受到极大的物理条件限制,如海事作业、应急救灾、高并发场景等。因此我们更加需.

2021-08-27 20:07:39 363

原创 开发者实践丨盲水印插件:用户端的实时视频溯源保护

本文作者是 RTE 2021 创新编程挑战赛获奖者董章晔团队。在实时音视频领域,视频内容会需要得到版权保护,而盲水印则是保护的措施之一。这支参赛团队基于声网 SDK 开发了一款应用于用户端的实时视频盲水印插件。其他使用声网 SDK 的开发者,也同样可以在自己的应用中使用该插件。访问『阅读原文』,可以查看该项目的源码。项目介绍视频盲水印技术是将标识信息直接嵌入视频 RGB 或 YUV 的频域中,基本不影响原视频的观看质量,也不容易被人觉察或注意。通过这些隐藏在载体中的信息,可确认内容创建者、使用者或者判断

2021-08-25 18:12:30 886

原创 Agora 教程丨一个典型案例,教你如何使用水晶球“数据洞察”

7 月初,声网Agora 水晶球的“数据洞察”功能正式版上线。“数据洞察”可显示两种数据,一种是用量,另一种是质量。“数据洞察”的“用量概览”最大的意义就是可以帮你回溯过去一段时间内的整体音视频分钟数趋势,为业务运营策略的复盘、调整提供数据参考。这些数据图表比较容易理解。不过第一次在“数据洞察”中看到“质量概览”的用户,可能感受到的只是扑面而来的多个数据图标,一时间还不知道,如何复盘曾遇到的质量问题,并一步步追根溯源。所以我们将通过一个测试案例,来一步步从发现问题、调查线索,到发现问题根据,带大家理解如

2021-08-23 20:26:36 364

原创 Springboot 结合 Netty 实战聊天系统

音视频技术为什么需要微服务微服务,英文名:microservice,百度百科上将其定义为:SOA 架构的一种变体。微服务(或微服务架构)是一种将应用程序构造为一组低耦合的服务。微服务有着一些鲜明的特点:功能单一服务粒度小服务间独立性强服务间依赖性弱服务独立维护服务独立部署对于每一个微服务来说,其提供的功能应该是单一的;其粒度很小的;它只会提供某一业务功能涉及到的相关接口。如:电商系统中的订单系统、支付系统、产品系统等,每一个系统服务都只是做该系统独立的功能,不会涉及到不属于它的功能逻辑

2021-08-20 21:08:59 1602 1

原创 实时语音质量监控

今天主要想介绍下,实时语音的质量到底是什么样的,大概介绍一下这个领域的一些已有的一些方法,然后会再介绍一下现有的方法,并且介绍一下未来想做的一些事情。语音质量评估方法首先,大概介绍一下语音质量评估,这个之前就一般从那个方法而言的话,是分为主观的一个评价方法,还有一个客观的评价方法的。那主观性评价方法的话,其实就是完全靠人的一个情感,那主观其实也是分两种的,一种是我完全不给你一个原始的参考信号,就是我只给你一段语音,然后你听完之后你来告诉我,你认为这在于它的分数是应该是多少,那还有一种方法呢,会给你一个锚

2021-08-18 19:26:40 735

原创 【音视频】弱网下实时视频的极限通信

弱网的场景弱网与常规的互联网还是不一样的,常规的互联网对于极限挑战,已经是不错的。无论是直播、点播,基础设施、网络设备以及压缩处理技术等已经完全可以满足高清、超高清、多视点等需求了。但对于弱网来说,比如:应急救灾、远洋海事、无人图传、边防监控等,这些场景往往需要实时的通信,但这些场景下,依赖基站通信存在一定的自然原因可能会导致通讯受限,甚至中断。比如:大规模泥石流、地震等自然灾害。极限通信架构基于弱网实际的场景,以及实际存在的问题,南大实验室提出了一个极限通信的架构,主要体现在三个方面:数据驱动

2021-08-16 18:02:41 1047

原创 音频技术及行业的发展

音频技术的重要性:在当今社会,工业科技革命的迅速崛起,大数据分析技术、物联网技术、音频技术等的相互融合快速发展,在生物、化学、人工智能等领域有了较大的市场和研究价值。对于音频技术在这之中起到了承上启下、不可或缺的一部分。对于音频技术在这之中起到了承上启下、不可或缺的一部分。虽然音频技术不是当下最热门、最主流的前沿技术,但在其前沿相关技术的使用,甚至是生活的方方面面都有音频技术的体现。一、音频技术的讨论:1.感觉音频技术没有“大数据”、“云计算”、“物联网”技术火?其实对于我们来说,就相当于我们平常.

2021-08-13 19:27:19 1726

原创 手把手 Golang 实现静态图像与视频流人脸识别

说起人脸识别,大家首先想到的实现方式应该是 Python 去做相关的处理,因为相关的机器学习框架,库都已经封装得比较好了。但是我们今天讨论的实现方式换成 Golang,利用 Golang 去做静态图像和视频流人脸识别的相应处理。静态图像人脸识别首先我们来进行静态的人脸识别,Golang 这边相较于 Python 社区来说相对少一些,不过依然有一些优秀的库可以供我们使用。今天我们用到的就是 go-face 这个库。该库利用 dlib 去实现人脸识别,一个很受欢迎的机器学习工具集,它可以说是人脸识别中使用最

2021-08-11 18:42:40 6544 4

原创 Golang 实现 RTP

在 Coding 之前我们先来简单介绍一下 RTP(Real-time Transport Protocol), 正如它的名字所说,用于互联网的实时传输协议,通过 IP 网络传输音频和视频的网络协议。由音视频传输工作小组开发,1996 年首次发布,并提出了以下使用设想。简单的多播音频会议使用 IP 的多播服务进行语音通信。通过某种分配机制,获取多播组地址和端口对。一个端口用于音频数据的,另一个用于控制(RTCP)包,地址和端口信息被分发给预期的参与者。如果需要加密,可通过特定格式进行加密。音视

2021-08-09 20:00:55 1047

原创 基于 HLS 创建 Golang 视频流服务器

HLS 是 HTTP Live Streaming 的缩写,是苹果开发的一种基于 HTTP 的自适应比特率流媒体传输协议, 并于 2009 年. HLS 流媒体已经成为应用最广泛的实时视频协议。它是一种将流分解成基于文件小段的格式, 可以通过 HTTP 下载,HLS 可以通过标准的 HTTP 或代理服务器等,这和基于 UDP 的协议(例如 RTP)不同。既然 HLS 现在如此受欢迎,那么它有那些优点和缺点呢。优点应用广泛首先,刚才已经提到过,HLS 是应用最惯犯的实时视频协议。虽然最初苹果是为了自己

2021-08-06 20:46:48 480

原创 读书日送书丨关于音视频技术你需要知道的二三事

写在世界读书日值此世界读书日,声网Agora 携手 InfoQ 联合推出读书日献礼,精选 50 本音视频技术好书,免费赠送给热爱写作的音视频领域技术创作者。领取规则点击底部【阅读原文】,参与“最新活动”填写报名表单,我们将图书快递到您手上。如在 InfoQ 写作平台(xie.infoq.cn)投稿,还将获得 500 元 / 千字稿酬,并有机会入选《架构师》电子刊,受邀参加声网 QCon 专场以及“2021 年 RTE 大会”。AGORA内容共建计划「Agora内容共建计划」旨在邀请热爱前端开发.

2021-08-04 19:26:37 119

原创 声网Agora发布教育信息化解决方案 助力教育公平提效

4月23日-25日,由中国教育装备行业协会主办的第79届教育装备展在厦门国际会展中心举办。作为赋能教育信息化的实时互动PaaS服务商,声网Agora应邀参会。展会现场,声网展示了基于实时音视频互动能力打造的“三个课堂”线上教学场景解决方案、承载“三个课堂”应用的互动录播解决方案,以及实时音视频在智能台灯、人脸闸机、电子班牌等教育硬件设备的应用,通过全套的教育信息化解决方案吸引了多家信息化服务商的关注。声网展台也同样受到了行业管理部门相关领导的关注,中国质量万里行促进会教育装备专业委员会理事长沈英琪、秘书

2021-08-02 20:25:26 529

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除