• 博客(305)
  • 收藏
  • 关注

原创 知物由学 | 机器聪明过人,“半监督”与“自监督”结合让AI模型训练事半功倍

购物网站为消费者推荐心仪的产品,导航为司机选择最佳路径,设备通过用户的生物特征鉴定身份,智能投资顾问监测、制定、投资复杂的金融产品组合……目前,深度学习,尤其是有监督训练,已经广泛应用于各行业中。在各位AI训练师的精心训(调)练(参)下,计算机更“懂”人类,而AI训练师也面临一些成长的烦恼:“找数据、提标注、做筛选、训网络”的流程是否已成为日常工作中的常规操作?“泛化性能不足”、“模型过拟合”等问题是否频繁影响着模型效果?当通过添加更多标注数据来解决上述问题时,花费高昂、耗时漫长的数据标注过程,是

2021-06-24 14:06:33 970

原创 知物由学 | 用户关系图谱在内容安全领域的应用实践

在内容安全领域,黑产用户的行为、关系网都有鲜明的特点。本文讲述了在强对抗背景下针对零用户样本和稀缺用户信息的难题,如何玩转大数据和图计算,捕获黑产用户在内容、行为、设备等方面深层次的鲁棒性特征。我们抛开了内容层面繁杂的细节,从一个新的角度为保障内容安全和构建用户风控体系提供了一种切实可行的技术路线。01 用户关系图谱设计的背景在虚拟网络中存在部分黑产用户,这部分用户多以色情或其他低俗内容为噱头,在成功吸引用户关注后,通过引流、分流等方式,将用户拉入私人聊天空间或其他平台,分步实施黄赌毒、诈骗、甚至枪支.

2021-06-18 14:44:19 1044 1

原创 知物由学 | 基于移动设备屏幕触摸数据的模拟点击检测研究与应用

还有些特殊情况,操作是“伪人为”的。将排好序的数据传入状态机,根据标准事件类型的跳转情况进行分割,不同的分割路径(初始到完结状态之间的的路径)对应不同的“触摸序列类型”,如:点击、拖动等。相比于基于外挂程序特征的外挂检测,基于深度学习的多引擎协作异常检测,大大提高了外挂检测的精度与覆盖范围,同时还能自动挖掘新的异常模式与变异外挂,使得整体外挂检测方案的效果更好,成本更低。依据建模的“触摸序列”,构建深度神经网络,提取“操作”当中的表征信息(行为的“秩序”),如:触摸轨迹变化规律,不同轨迹之间的关联等。

2023-03-17 14:57:18 1199

原创 知物由学 | 一文了解内容检测性能测试自动化建设

此时kafka的topic中既有真实流量又有压测流量的数据,就算立马停止压测,也会影响线上真实流量数据的消费速度,影响用户体验。还是用易盾内容检测来举例,我们创建一个QPS目标值200的压测任务,这个压测任务被拆分成了5个梯度,每个梯度的压测目标值从小到大分别是40,80,120,160和200。临近春节,打工人要抢回乡的火车票,2019年12月23日,有大量网友反映,12306网站突然崩了,在购买车票的时候出现无法登录、无法购票、车次加载失败、页面卡住等情况,疑似因访问流量过大而出现服务器崩溃。

2023-03-17 14:55:01 545

原创 知物由学 | 插件 APK 保护方案介绍,化解 Android 生态中的安全漏洞风险

通过 Hook 系统 Framework 层与组件启动相关的接口,并在 Manifest 文件中注册预先占位组件,达到欺上瞒下的效果,启动的是宿主中占位的组件,实际执行的代码逻辑是插件中相应组件的逻辑,由于宿主中占位的组件被注册过,被 Hook 代理的插件组件生命周期和原生组件基本上是一致的。宿主:所谓宿主,就是需要能提供运行环境,给资源调用提供上下文环境,一般也就是我们主 APK ,要运行的应用,它作为应用的主工程,实现了一套插件的加载和管理的框架,插件都是依托于宿主的 APK 而存在的。

2023-03-17 14:49:15 333

原创 知物由学 | 多级建模方法提升汉语语音识别效果,获ISCSLP大赛认可

具体地,多级建模方法基于 Encoder-Decoder 的架构,使用多任务学习 hybrid CTC/Attention[1] 方式进行训练,其中 CTC 分支使用音节作为建模单元,使得模型可以学习到从语音特征序列到音节序列的映射信息,而 Attention 分支使用汉字作为建模单元,利用序列上下文信息和声学特征将音节转换为最终输出的汉字。下图展示了我们的多级建模系统架构。在本文中,我们提出了一种多级建模单元的端到端汉语语音识别方法,通过多级建模的方式,模型可以融合学习多级信息。2.为什么要用多级建模?

2023-01-12 15:15:30 695

原创 知物由学 | SO VMP 加壳与混淆,为移动应用提供函数级保护

VMP 是一种用于软件保护的软件,对软件进行加壳,加固厂商都有自己的 VMP 方案,但值得注意的是,native 层的 VMP 方案并不成熟,兼容性只是其中一个影响因素,性能更是导致该方案无法普及的重要原因之一。

2022-12-30 15:05:33 1821

原创 NLP 模型“解语如神”的诀窍:在文本分类模型中注入外部词典

一方面能显著提升模型的召回能力,减少业务漏判,另一方面,在中文互联网这个黑话频出的环境,可以在不更新模型的前提下让应用系统适应外部语言环境的变化发展。

2022-12-13 17:42:07 804

原创 知物由学 | 弹幕蜂拥而入,智能审核平台如何用技术破局?

导读:弹幕的出现增加了视频观看者的深度参与感,弹幕也逐渐成为国内各大视频网站最基本的评论交互形式,本文将通过网易易盾在弹幕实现原理及交互方式方面的实践,具体介绍弹幕相较于传统聊天室的区别与实践经验,希望能为大家在弹幕系统设计方面带来一些借鉴。在 2022 年的今天,弹幕在国内的各大视频网站已经成为了一个最基本的评论交互形式,它为视频社交增添了很大的活力,然而这也给视频内容的审核工作带来了巨大挑战,在较为严格的审核场景下,数量庞大的弹幕通过机审后,我们会进行一轮或多轮的人工审核,但是为了不误判,易盾的智能审核

2022-11-18 09:52:01 726

原创 MCtalk 创业声音丨领跑“手办”题材2年,《高能手办团》如何实现国内出海两开花?

不久前,手办主题游戏《高能手办团》刚刚度过了自己的 2 周年,上线至今这款游戏仍是手办及相关题材爱好者首屈一指的游戏之选。在经历近几年游戏行业诸多变化和挑战后,这款游戏背后的研发公司 — 心光流美是如何在垂类题材中保持头部地位的呢?本期 MCtalk 对话心光流美 CTO 陈虎。他表示,近三年来手游行业人口红利逐渐消退,进入存量竞争,但竞争中仍存在机会,心光流美选择团队擅长且兼具长期价值的方向突破,利用技术和内容创作优势撬动玩家热情。

2022-10-18 10:38:46 700

原创 “易+”开源 | 简单可信赖,GameSentry 正式开源

2022 年 9 月 15日,网易智企“易+”开源计划正式发布网易易盾游戏安全测试工具——GameSentry,本文将从技术角度分析 GameSentry 的设计逻辑与设计经验。

2022-09-27 18:50:55 1080

转载 解密数字时代 AI 加持之道,网易智企联合机器之心发布 AI 应用实践白皮书

企业服务领域首个AI应用实践白皮书,更多展现B2B技术厂商的AI技术实力和落地应用能力。

2022-09-22 14:59:21 293

原创 知物由学 | AI与黑产的攻守之道,详解攻击类文字图像的检测

大规模相似性特征的训练离不开自监督学习,自监督学习能以较低的成本学习到一个效果优越特征模型。但仅靠自监督学习也让模型局限在自我(self)的世界里,潜在地降低模型的泛化性,反应到线上实际应用中,会存在召回率低的问题。如何解决这个问题又是另一个新的课题,目前易盾探索了一条结合主动标注和度量学习的算法方案,逐步引导模型学习潜在的邻近关系,并取得了一定的效果。未来易盾会持续跟进业界和学界的最新方法,为这类对抗垃圾治理提供更多的解决方案。参考资料。

2022-09-19 19:33:47 1153

原创 知物由学 | Android 模拟点击研究,如何突围“黑灰产”的自动化作弊?

不论是破坏软件的营销策略,还是破坏游戏的生态体系,都会影响到正常用户的使用体验,影响游戏厂商的收益与口碑。

2022-08-29 19:17:12 1819

原创 知物由学 | “群控软件”助长黑灰产套利的零和游戏,硬核技术打击隐秘的不公

:群控系统一般由多个部分组成,例如在手机端运行的服务、在手机端用于模拟输入的输入法、在 PC 端用来对所有设备操作与监控的中控台、在服务器中运行的连接所有设备的服务端等。本文主要介绍对群控软件技术的相关研究与实践。文|李伊洋 网易易盾 Android 安全工程师群控功能:区别于模拟点击工具,群控系统一般由多个部分组成,例如在手机端运行的服务、在手机端用于模拟输入的输入法、在 PC 端用来对所有设备操作与监控的中控台、在服务器中运行的连接所有设备的服务端等。

2022-08-24 19:15:53 6212

原创 SAGI GAMES 创始人曾嵘:瞄准休闲游戏,将“创意”转化为“商业”

秉承着“创造长期伟大的游戏,创造最佳的环境让团队成功”的愿景,背负着“用游戏改变生活”的使命,团队将大部分精力凝聚在打磨游戏作品上,全面投入到游戏的研发中,通过外部合作渠道实现作品的商业化。去年以来,SAGI GAMES 基于自身集研发和发行为一体的优势,多方联系武汉本地的游戏企业和创业者,希望形成一个游戏产业联盟的圈子,在激烈的竞争中,将前赴者踩过的坑也好,获得的创业经验也好,顺利让渡给后继者,帮助游戏创业者做出纯粹的选择,共同成长。隐藏于这一回答之下的是,技术从业者的一颗单纯的“赤子之心”。...

2022-08-11 17:39:02 723

原创 知物由学 | 垃圾内容肆虐,自监督学习助力“内容风控”效果提升

在深度学习领域中,研究人员发现,有监督学习存在标注难度高的问题,尤其是在内容业务端的风控过程中数据“大爆发”。因此,自监督学习的相关研究在近年蓬勃发展起来,达到并超越了有监督学习。通过借助无标签数据与无监督训练任务,自监督学习可有效改善传统有监督算法中“泛化性能不足”、“模型过拟合”、“严重依赖数据标注质量”等问题。那么,如何开展自监督学习?文章对自监督学习的方法做了超详细的解读,展示了SimCLR、Moco、BYOL三个方向,并介绍了各自的优势和应用场景。快来学习与分享吧。...

2022-07-01 14:17:48 376

原创 知物由学 | 行为时序建模在社交引流黑产识别中的应用

大数据与人工智能技术的出现为反欺诈提供了解决方案

2022-06-09 17:28:07 1101

原创 Unity 游戏保护“大练兵”,一文读懂游戏事前防御

随着游戏行业的火热发展,对游戏进行恶意攻击的黑产业务愈演愈烈。在遭受网络窃贼的攻击后,存在游戏玩家的虚拟设备与游戏账号被盗的现象,这使得安全问题成为玩家与厂商之间以及玩家与玩家之间冲突的主要来源。

2022-05-30 13:48:11 630

原创 MCtalk创业声音丨博学明辨:兴趣社交,给退休前后老年朋友的「小而美」空间

每个时代都有属于自己的旋律,而创新与创业是时代更迭中不变的主题。从工业时代、信息时代,再到智能时代,从不缺少勇敢奋进的开拓者们,有人顺势而起,有人败兴而归,有人错过一个风口后依然满怀期待地等待下一个。他们的阅历越来越丰富、知识越来越渊博、意志越来越坚韧,获得了全方位的淬炼。《MCtalk创业声音》是网易智企推出的全新栏目,旨在关注各行各业变革、聚焦创新创业领袖。通过对话明星创业者,分享他们的创业故事和对行业的真知灼见。这是《MCtalk 创业声音》的第05期老年人陷入孤独的根源大多在于某种形

2022-05-26 11:35:02 363

原创 知识蒸馏如何快速提升人工智能模型的性能?

本文主要介绍知识蒸馏领域的两种经典算法,一篇是基于输出 logits 的知识蒸馏工作 KD [2],一篇是基于 CNN 的中间层特征的知识蒸馏工作 FitNet [4]

2022-05-19 11:04:52 371

原创 知物由学 | 一文读懂Android资源文件保护

一、前言随着Android应用被破解和被盗版的案例越来越多,程序安全逐渐引起用户的重视。在激烈的攻防过程中,安全保护手段不仅限于代码,还有资源文件。这是由于资源文件会暴露出大量敏感信息和破解线索,一旦被篡改或被删除,程序将无法正常运行。加固是保护程序安全的重要途径之一,更是程序合规上架的必然要求。本文针对第三方apk的资源保护(加密)方案进行简单的梳理,以帮助用户更好地选择和使用加固产品。二、资源文件介绍先来看看资源文件的解释。安卓资源文件一般指res和assets目录下的文件,而res

2022-03-30 18:45:28 6502

原创 知物由学 | iOS应用的隐私合规技术介绍与技巧

一、隐私泄露问题移动互联网时代,智能手机已经成为人们工作生活必不可少的工具。2021年8月27日,中国互联网信息中心发布的第48次《中国互联网络发展状况统计报告》显示,截至2021年6月,中国手机网民的规模已达10.11亿,同2020年底相比增加了近2175万人。中国的智能手机持有率提升至96.3%,近乎人均一部智能手机。智能手机中有三种主流的操作系统,分别是Android、iOS和Windows Phone。而其中应用从基础的社交娱乐、网络查询,到手机支付、互联网金融,再到教育、医

2022-03-30 17:49:35 8418

原创 知物由学 | 弱监督语义分割:从图像级标注快进到像素级预测

语义分割,旨在将图像中的所有像素进行分类,一直是计算机视觉图像领域的主要任务之一。在实际应用中,由于能准确地定位到物体所在区域并以像素级的精度排除掉背景的影响,一直是精细化识别、图像理解的可靠方式。

2022-03-30 16:13:31 9916 1

原创 知物由学 | Android应用破解与防护,阻断猖獗的应用乱象

前言大数据时代,移动应用(APP)数量多、应用领域也广泛。APP遭破解而导致数据被窃取、个人隐私信息泄露、被盗版山寨的事件并不少见,不仅危害着用户信息安全与财产安全,也影响到正版开发者的知识产权经营。据国家互联网金融风险分析技术平台发布的监测数据,截至2020年2月底,发现互联网金融盗版网站4.81万个,受害用户达12万人次,互联网金融盗版APP2801个,盗版APP下载量3343.7万次。APP的破解与反破解是Android应用攻防领域的永恒主题,由此衍生了许多攻防对抗的技术手段,如加壳与脱壳,调试

2022-02-18 14:27:40 4244 1

原创 知物由学 | 增量学习助力内容风控

01 背景和动机近年来,以神经网络为代表的人工智能技术取得了空前的发展。然而,当前的深度学习往往遵循构建静态数据集,在此基础上进行模型设计和训练范式,这与人类在学习生涯中不断积累和学习新知识的过程有很大差别。在现实任务的场景中,由于隐私、数据存储或者算力限制等问题,无法充分保存旧的样本,例如,在个人设备上部署的人工智能系统,同时受到隐私保护、计算能力和存储空间的约束,无论是保存旧数据,还是积累新数据都不可行。在内容风控业务中,黑产为了绕过图像鉴别系统,新的图片形式和攻击样例不断出现。在出现新的类别或者新

2022-02-15 11:29:57 1592

原创 业务直达全球,服务器机房部署如何顺势而“变”?

近年来,服务器机房多次出现光缆被挖、机房掉电等风险事故。受此影响,支付宝、微信曾一度被迫中断业务。多机房部署在提升访问速度的同时,能够有效应对极端故障事件,一举多得。随着易盾验证码用户量的增多,特别是海外用户的增长,原有单机房的架构已无法支持业务的发展。易盾引入多机房后,用户就近访问,有助于提升验证码加载速度,带来更好的使用体验。本文主要介绍了常见的多机房部署方案,实际落地过程中遇到的问题以及对应解决方案,希望对大家有所帮助。01 多机房的技术挑战多机房的任务协调:请求路由和会话保持多机房后,一个

2021-12-28 14:17:34 722

原创 知物由学 | “找茬”不如交给AI算法,细说文本纠错的多种实现途径

顾名思义,文本纠错就是将文本中有错误的地方进行纠正,错误类型包含错别字、缺失字、冗余字、词语搭配错误和语法错误等。目前也有一些开源的文本纠错工具,比如pycorrector等,虽然这些工具可以满足一部分场景中的文本纠错需求,但其效果距离真正应用还有较大的差距,所以十分有必要自行上手构建一个文本纠错系统。近年来,错别字连篇的法律文件、写错国家机构的新闻报道、国名有误的发布会现场,无不成为网友热议的对象。为何低级错误无人发现?为何专业人士竟在文字上遭遇“滑铁卢”?一连串的质疑也说明,文本纠错是内容安全的首当其

2021-12-28 13:56:57 2979

原创 知物由学 | 只要这几步,Unity游戏全方位保护升级

一、背景“Unity目前已经全面覆盖到各个游戏平台,超50%的手机游戏、PC游戏和主机游戏基于Unity引擎制作而成,全球月活跃创作者多达150万,遍布190多个国家和地区。此外,2019年全球收入前一百的工作室中,有93%的开发者在使用Unity的产品。”可以看到,Unity作为目前市场的第一大游戏引擎占有者,受到越来越多的游戏开发者和制作者的青睐,同时Unity游戏会被一些攻击者和“别有用心”的人盯着,不仅影响到了游戏市场与游戏玩家的公平,而且或缩短游戏自身的生命周期。本文将重点围绕“反破解”讲述

2021-12-28 10:34:49 2527

原创 知物由学 | 易盾SaaS系统资损防控体系建设

背景易盾业务主要分内容安全、业务安全和移动安全三部分,内容安全主要给客户提供反垃圾机器检测能力,文本、图片和音视频。并和人工审核、SAAS审核系统组合成全家桶。业务安全主要是提供认证类的服务,包括验证码,号码日志,信息认证。移动安全是通过加固和其他手段保护客户的应用,防止被逆向破解。结算业务是易盾最重要的基础服务,承担着易盾的资金管理工作,随着易盾用户量的高速增长,结算业务承担的责任越重,风险也越大。自然而然,对于我们测试同学也提出更高的要求。在我们搭建这套体系前,回归手段比较传统,自动化用例维护成本较

2021-12-27 17:11:30 815

原创 【语音之家】AI产业沙龙—— 网易语音AI技术:从内容安全到内容品质

由CCF语音对话与听觉专委会、中国人工智能产业发展联盟(AIIA)评估组、网易易盾、语音之家、北京希尔贝壳科技有限公司共同举办的【语音之家】AI产业沙龙–网易语音AI技术:从内容安全到内容品质,将于2021年12月8日19:00-21:30通过语音之家微信视频号直播。沙龙简介智能语音技术在网易的应用方式丰富多样,借助多场景下的海量数据,衍生出众多技术驱动的应用场景,从内容安全保障,到内容质量挖掘,让用户在内容海洋中尽情遨游。网易易盾团队通过语音关键词识别和语义理解,助力平台更快、更好、更低成本地筛选出.

2021-12-10 11:26:33 5478

原创 知物由学 | 听声辨人,看声纹识别技术如何保障内容安全?

大家对“指纹”并不陌生,但听说过“声纹”吗?“违法犯罪变得越来越困难了。如今罪犯都没法使用电话了,因为侦探们可以通过他们在话筒上留下的声纹来追踪他。”一则刊登在1918年10月的《田纳西人日报》中的笑话首次提及“声纹”,并将其比作“指纹”,能用来定位到具体的犯人,帮助警方刑侦调查。后来玩笑逐渐变成了现实,虽然声音所过之处并不会留下任何痕迹,但是声音本身却蕴藏着身份的蛛丝马迹。与“指纹”一样,每个人拥有独一无二的“声纹”。随着深度学习时代的到来,声纹识别领域自然而然地形成了“百家争鸣”的局面,许多实际应

2021-12-09 11:01:33 6069

原创 知物由学 | Windows反外挂的数据对抗

只要你在电脑上玩过游戏,那你或多或少都听过甚至遇到过游戏中的“战神”——即那些开挂的恶劣用户,他们不仅让游戏失去公平,影响了他人的游戏体验,还使游戏本身失去了乐趣。既然外挂破坏了游戏生态,Windows系统是怎样防止外挂的呢?一、前言由于Windows操作系统进程间相对开放,不具有类似移动平台的进程沙箱隔离机制,因此无论是外挂的种类、实现方式,还是打击外挂的手段,都会相对复杂一些。细化地说,像一些常见的杀毒软件、输入法、直播推流软件均存在对外部进程的访问、数据读取甚至是内存修改的行为,若是强行将所有Ho

2021-11-26 15:39:59 6498 9

原创 知物由学 | 图像检索技术怎样准如“雷达”,从一张到亿张精准定位图片违规?

在Web2.0的时代下,图像、视频等各类异构数据每天都在以惊人的速度增长。如何在茫茫图库中方便、快速、准确地找到所需图像?你是否还在为如何检索到真正想要获取的图像的关键字而苦苦烦恼?你是否发现目前基于文本描述的图像搜索结果在大规模图像中结果往往差强人意?追根溯源,这是由于基于文本的图像检索在外来的图像入库时离不开人工的干预。文本描述的特征依赖于人工标注的介入,导致图库受到标注者的认知水平、言语使用以及主观判断等的影响,造成图像的文字描述存在差异。同时,标注费时费力,这类方法并不适用于海量图像库的检索。针

2021-11-09 10:11:43 617

原创 知物由学 | 易盾“验证码”互联互通的背后,小程序SDK的跨平台转换技术

多平台背景小程序是一种无需安装即可使用的应用。从2017开始,小程序增速加快,潜力巨大,因此许多互联网平台都拥有都加快了小程序发展步伐,出现了如微信小程序,支付宝小程序,百度小程序等。易盾的行为式验证码功能自从推出微信小程序SDK后,受到许多客户的好评,并接到大量其他平台的咨询。从产品和业务的发展角度考虑,支持更多平台的小程序能更好地满足客户的需求,增强自身产品亮点。为什么做转换工具当SDK需要支持多个平台时,若每个版本都单独维护则会增加大量维护成本,因此我们需要一个方案来解决跨端输出问题。经过调

2021-10-15 10:09:25 468

原创 知物由学 | 遇到外挂,游戏厂商怎么办?

知物由学 | 遇到外挂,游戏厂商怎么办?随着移动互联网的发展,手游行业经历了巨大的变迁,不仅仅是从技术上的革新,游戏实现能力更是有了飞跃式发展,但是在手游市场竞争日趋激烈的背后,其安全正受到网络黑产的巨大威胁,非正当获利在移动游戏领域屡见不鲜,外挂等安全性问题成了开发者们不得不面对的难题。据《2020移动游戏质量白皮书》数据统计,国内定制类外挂比例达到66%,较19年增长6.5倍。海外定制类外挂比例已经达到了62%,较2019年增长了足足3倍,尤其是强竞技游戏品类的外挂对抗挑战持续增大。在2020年

2021-10-11 15:09:19 510

原创 知物由学 | 一种新型自研白盒密钥算法,让攻击者无迹可寻

知物由学 | 一种新型自研白盒密钥算法,让攻击者无迹可寻随着信息化的发展,数据安全显得越来越重要,因此对数据的存储和传输进行加密操作逐渐进入大众视线。数据加密的过程中必然涉及由一系列参数组成的密钥,而密钥正是攻击者所垂涎的目标,这是由于相比于破解加密算法,盗取密匙要来得更为容易,也是直通数据“仓库”的捷径之一。因此,密钥安全称之为“数据安全的基础”也不为过,尤其是在不可信的移动端环境中,常见的有获取了最高权限的 Android、iOS 设备。 本文基于移动端密钥使用和存储的痛点,介绍了一种自研的白盒加密

2021-10-11 15:05:45 1153

原创 知物由学 | 驱动反外挂另辟蹊径,让游戏避免看不见的漏洞攻击

工欲善其事,必先利其器。游戏攻防对抗亦是如此,外挂作者通过各种工具提升游戏破解效率,通常防御方会根据其工具特性针对性防御。此种场景下的防御似乎总是后人一步。难道就没有好的办法了吗?为了解决这个痛点,通过对市面上外挂作者攻击手法分析,发现无论哪种类型的工具、外挂都离不开对游戏信息的获取。而驱动反外挂正好将此处破绽给防御住。01 对抗场景通常,一般反外挂产品会启动基于钩子扫描、可疑模块/进程扫描、文件/代码块签名、加壳混淆、关键字扫描、调试状态等特性。以保护游戏或检测计算机内存和进程中可能存在的作弊行.

2021-10-11 11:37:57 2376 1

原创 知物由学 | 告别挑花眼,AI算法如何筛选低质量图片?

知物由学 | 告别挑花眼,AI算法如何筛选低质量图片?随着手机相机的升级,随手拿出手机拍照已经成为很多人不经意的日常,手机相册、电脑硬盘中存储的照片数量或许早已悄然过万。各类社交平台上,每一秒都有数不胜数的图片被上传和分享。那么,如何才能轻松筛除手机相册中低质量的照片?如何才能从社交平台上的海量数据中挑选出高质量的图片用于首页展示和推荐?如何才能预先过滤低质量的图片以提高后续内容审核模型的效率……在面对这些难题时,图像质量评估算法体现出了极大的应用价值。背景介绍图像质量是一个宽泛的概念,在不同场景下

2021-10-08 10:24:59 1723 1

原创 知物由学 | 再造巴别塔,我们如何进行NLP跨语言知识迁移?

知物由学 | 再造巴别塔,我们如何进行NLP跨语言知识迁移?自以 BERT 为代表的预训练语言模型诞生起,关于其跨语言版本的探索研究就从未停止过。2020 年 4 月,Google 发布了 XTREME 基准,迅速成为跨语言预训练模型的黄金评测集。XTREME 包含文本分类、序列标注、句子召回、问答四个大类共九个子任务,参评模型需要在英文训练数据上进行调优,然后在其他 12 个语系的 40 种语言的各自测试集上进行推理预测。得分越高,意味着模型能更好地将从优势语种(英文)中学习到的知识,迁移到小语种应

2021-09-28 15:09:24 724

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除