一天搞定 6 个月工作!OpenAI 曝光 GPT-4 新功能「内容审核」

48203253b6dcd9486c1699ee857d6a35.gif

整理 | 朱珂欣   

出品 | CSDN程序人生(ID:coder_life)

GPT- 4 到底有多强?

问世以来,代码编写、数据分析、图表生成、执行数学运算、生成视频、分析股票市场……都不在话下,让无数网友感慨:这是要“逆天”了!

如今, GPT-4 的新功能直逼「内容审核」,可以帮助企业一天完成 6 个月工作量。

c6ad76155058edf07d39223512d80f8f.png

30a4b4338f098180d63178ba6eeb52e9.png

与传统方法相比,GPT-4 内容审核的优势

众所周知,传统内容审核在现阶段面临多种挑战。

  • 需要人工细致的审核、对上下文的深刻理解、快速对新用例的适应,耗时且挑战性较大。

  • 传统内容审核的重担落在「审核人员」身上,给人带来巨大的精神压力。

为此,OpenAI 表示, GPT-4 目前正在测试内容审核功能,它被用于制定和完善内容政策、标记内容和制定决策。

任何拥有 OpenAI API 访问权限的人都可以创建自己的 AI 辅助审核系统。

一方面,可以执行内容审核任务,加速处理内容审核等繁重任务,提高社交媒体公司的工作效率。

另一方面,还能使在线平台能够更快制定新内容审核规则,并完善现有规则

OpenAI 官方称:“内容审核过程本身就很缓慢,GPT-4 的新功能可以帮助审核过程能从 6 个月缩短到几个小时。”

目前,最新的 GPT-4 相较于传统的内容审核方法,存在以下优势: 

  • 提供一致的判断。由于内容政策不断发展并且十分详细,GPT-4 的这项新功能能对措辞的细微差异很敏感,可以立即适应政策更新,为用户提供良好的内容体验。  

  • 提高审核的反馈效率。政策更新的周期漫长,GPT-4 的这项新功能可以将这一过程缩短至几个小时,从而能够更快地响应新的危害。

  • 减轻审核人员精神负担。持续接触有害、令人反感的内容,容易导致审核人员情绪疲惫和心理压力。为此,GPT-4 的这项新功能能为相关工作人员思想减负。

f334b709461a5f34144c29f84d5949f2.png

905ff6b352543237586056b2371d6fe0.png

如何利用 GPT-4 进行内容审核?

事实上,由 AI 驱动的审核工具并非什么新鲜事,Meta、YouTube 和 TikTok 等平台已经利用算法来控制有害和非法内容。

据 The Verge 往期报道,2020 年时,Meta(前 Facebook) 就明确表示希望 AI 在平台上承担更多的审核职责。

其审核原理为 :被认为违反公司规则的帖子(包括从垃圾邮件、含仇恨言的内容)会被用户或机器学习过滤器标记。随后,一些明确的案例会自动处理(删除帖子、阻止帐户),而其余案例则进入队列供人工审核员审核。

由此可见, OpenAI 的这枪「内容审核」并非首发。

db167fde60c6c4396c5a0ebeaa6befbd.png

据官方消息,这项由 GPT-4 领衔的内容审核工作,目前涉及多个工作流程。

  • 首先,公司必须创建一个包含有害内容示例的数据集

  • 随后,指示 GPT-4 用标签标记每条有害内容,并描述其违反审核政策的原因。

  • 最后,通过审查模型生成的标签,以此发现问题

就目前的情况而言, GPT-4 对于某些缺乏开发自己的内容审核系统资源的小公司,无疑是一个可行的选择。

a2402ccb386b2be3b342c6f3144c6a59.png

历史里程碑 or 巨大的挑战 ?

当然,GPT-4 也并非完美。新功能虽然前景广阔,但仍然存在局限性。

在内部测试中,OpenAI 将 GPT-4 与人类内容审核团队进行了比较。

结果显示,现阶段 GPT-4 表现优于接受过“轻度训练”的审核人员,但准确性不如“经验丰富、训练有素”的审核人员。

28cee52f9a9c8dc58d5cb59fab3384a4.png

值得关注还有 —— 语言模型的判断很容易受到训练期间引入模型的不良偏差的影响。特别是误导性、错误性和攻击性内容(不一定是非法的)的灰色区域给自动化系统带来了巨大的挑战。

与任何 AI 应用程序一样,结果和输出需要审核人员参与其中来仔细监控、验证和完善。

为此,OpenAI 也强调,审核的过程不应该完全自动化。

事物发展总是利弊共存,在 OpenAI 曝光的 GPT-4 新功能内容审核后,也引发了许多业界人士的积极讨论。

  • OpenAI 的产品政策经理 Andrea Vallone 认为:“在这种情况下,审核人员可以更侧重在对可能有内容违规的极端案例如何做评判,以及怎样完善内容的政策。”此外,他也强调称:“我始终认为,人类始终参与其中是很重要的。

  • OpenAI 安全系统负责人 Lilian Weng 在接受 Semafor 时表示:“这为如何利用 AI 造福社会、解决现实世界的问题,向前迈出了非常好的一步。”

  • 外媒  Semafor  记者 Reed Albergotti 坦言:“人类实际上不太擅长内容审核,因为即使人能够记住每条规则,也会不断有内容陷入灰色区域,无法给出明确的答案。GPT-4 虽然不是完美的,但避免了人们在工作中整天查看令人不安的内容。

对此,你怎么看?

参考链接:

https://openai.com/blog/using-gpt-4-for-content-moderation

https://www.theverge.com/2023/8/15/23833406/openai-gpt-4-content-moderation-ai-meta

https://www.semafor.com/article/08/15/2023/can-chatgpt-become-a-content-moderator#room-for-disagreement

推荐阅读:

天才少年稚晖君离职华为首秀,官宣智元人形机器人;特斯拉自动驾驶着手落地中国市场;微软高管称程序员等岗位十年内被AI淘汰|极客头条

代码生成超越 ChatGPT,科大讯飞发布智能编程助手 iFlyCode!星火大模型能力再升级

▶非技术岗的 AI 产品经理年薪近百万美元,美国公司开启“抢人大战”!

919540409d000743c388282933bcd9cb.jpeg

### 比较OpenAI GPT-4GPT-4o模型 #### 特征差异 GPT-4代表了OpenAI在大型语言模型技术上的最新进展,具有更高的参数量和改进的架构设计,旨在提供更为流畅自然的语言理解和生成能力。相比之下,关于GPT-4o的信息较少,通常认为这是针对特定优化版本或是内部使用的变体之一[^1]。 #### 性能对比 具体到性能方面,在公开资料中并没有直接提及GPT-4o的具体评测数据。然而,基于一般模式,可以推测GPT-4o可能是在原有基础上做了针对性调整或优化,比如提升了某些应用场景下的效率或者降低了资源消耗等特性。而标准版GPT-4则经过大规模预训练并广泛应用于多种任务场景,其泛化能力和适应范围更加广阔。 #### 应用领域 由于缺乏详细的官方说明文档来描述两者之间的区别,对于想要深入了解两者的不同之处以及各自适用场景的人来说存在一定难度。但从逻辑推断来看,如果存在所谓的"GPT-4o"版本,则很可能是为了满足特殊需求而定制开发出来的分支版本;它或许会在特定行业应用中有更好的表现,或者是专门为某类计算环境进行了适配性改造。 ```python # 这里仅展示如何通过Python代码加载两个假设存在的模型进行简单推理演示, # 实际操作需依据实际可用API接口编写相应程序。 import transformers as trf model_name_4 = "openai/gpt-4" tokenizer_4 = trf.AutoTokenizer.from_pretrained(model_name_4) model_4 = trf.AutoModelForCausalLM.from_pretrained(model_name_4) # 假设GPT-4o也存在于Hugging Face Model Hub中 model_name_4o = "openai/gpt-4o" tokenizer_4o = trf.AutoTokenizer.from_pretrained(model_name_4o) model_4o = trf.AutoModelForCausalLM.from_pretrained(model_name_4o) text_input = ["Tell me about the weather today."] input_ids_4 = tokenizer_4(text_input, return_tensors="pt").input_ids output_4 = model_4.generate(input_ids_4) input_ids_4o = tokenizer_4o(text_input, return_tensors="pt").input_ids output_4o = model_4o.generate(input_ids_4o) print(f'Output from GPT-4:\n{tokenizer_4.decode(output_4[0], skip_special_tokens=True)}') print(f'\nOutput from GPT-4o:\n{tokenizer_4o.decode(output_4o[0], skip_special_tokens=True)}') ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

CSDN资讯

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值