ChatGPT 的学习笔记

技术人员,没法绕过ChatGPT,试用了一些时间,也在网上进行了学习,提供了一些关键词,然后让ChatGPT自已生成的一篇介绍文章:(我只是稍作修改,因为有些我认为有意思的内容被ChatGPT省略了)

摘要:本文将介绍ChatGPT的相关知识,以及如何利用这一技术改变我们的生活和工作方式。从ChatGPT的原理、技巧,到与人类创作的关系,我们将全面探讨这一领域的发展趋势。

一、ChatGPT简介

作为一种基于Transformer模型的人工智能,ChatGPT引领了自然语言处理技术的发展。相较于传统的分析式AI,ChatGPT采用生成式、预训练的方法,并结合注意力机制和强化学习,实现了超大规模的自然语言处理。在理解人类意图方面,ChatGPT做得相当出色,使得机器能够更好地理解和回应人类的需求。

二、注意力机制与强化学习

注意力机制使得AI能够区分信息的重要性;而强化学习则通过奖惩机制,帮助AI持续学习和进步。这两种技术结合在一起,为ChatGPT提供了强大的学习能力。

三、提问技巧与Prompt

要充分发挥ChatGPT的优势,学会提问是关键。明确表达意图、提供足够多的样例,并学会使用思维链、拆分问题,都有助于获取更好的回答。这种能力在某种程度上类似于领导的管理能力。

四、生成式AI与创作

与分析式AI不同,生成式AI具备创作能力。事实上,一旦掌握了背后的模式,很多创作型工种都有可能被AI取代。相比之下,分析式AI(如抖音推荐)局限于旧数据。

五、AI的极限

AI的发展受制于芯片(算力)、能源(电力)和人力(标注工程师)等多方面因素。而ChatGPT本身也并非无所不能,例如它讲的笑话很烂,无法预报天气,且不具备实时联网功能。受限于数据只有2021年以前的。

六、OpenAI的股权结构与初衷

OpenAI背后有一个神奇的股权结构,旨在确保AI不被用于恶意目的。这一理念与谷歌的“不作恶”原则相契合,体现了马斯克等创始人的远见。(四个阶段,一阶段接受捐赠和入股,二阶段将让大股东控股75%,收回130亿投入。三阶段当收入950亿,微软股份降至49%。四阶段收入1500亿,所有股份回归OpenAI)。(其实,OpenAI成立初始,是为了对抗google的,怕它搞垄断,怕google作恶,哈哈哈)

七、ChatGPT在国际市场的应用

美国已有70%的企业在使用ChatGPT,49%的企业通过其节省人力。然而,

由于某些原因,中国尚未大规模应用ChatGPT。目前,国内的一些类似技术如文心一言和字节跳动的AI仍有一定差距。此外,最要命的是, 受限于GPU的采购,中国在算力方面与美国存在先天的差距。

八、AI与人类共生

AI不会取代人类,真正威胁人类的是那些会使用AI的人。与AI共生是未来发展的关键。我们需要学会利用AI的力量,提升自身能力,迎接未来的挑战。

结语:

ChatGPT作为一种先进的人工智能技术,为我们的生活和工作带来了诸多变革。掌握这一技术并与之共生将成为我们在未来世界立足之道。从提高提问技巧,到了解AI的局限和发展趋势,我们需要不断学习,以便更好地利用这一强大工具。

对于上面生成的内容,你肯定会有一些不能理解的,但如果有chatGPT,这事儿就很好解决了。
比如,可以再提问:
对于chatGPT在使用强化学习方面,能不能再深入的阐述一下,最好能用比较非技术化的语言。
回答:
 

当然可以。在深入了解ChatGPT如何利用强化学习之前,我们首先要简单了解一下什么是强化学习。强化学习是一种机器学习方法,它通过让AI系统在与环境互动的过程中学习。系统会根据自己的行为获得奖励或惩罚,从而调整策略,以达到最大化奖励的目标。

将强化学习应用于ChatGPT,可以类比为一个人在学习如何更好地与他人交流。在交流过程中,如果一个人说了什么让对方感到愉快或满意,他就会得到积极的反馈(奖励),从而更倾向于继续使用这种沟通方式。相反,如果他说了什么让对方不舒服或困惑,他就会得到负面反馈(惩罚),从而避免再次使用这种沟通方式。

在ChatGPT的训练过程中,强化学习主要帮助模型更好地生成与用户意图相匹配的回答。具体来说,模型会根据用户输入(问题或要求)生成多个可能的回答,然后基于预设的评估标准对这些回答进行评分。评分高的回答将获得奖励,而评分低的回答将受到惩罚。通过不断迭代这一过程,ChatGPT学会了如何生成更符合用户期望的回答。

用非技术化的语言来说,强化学习就像是一个不断试错、学习、调整策略的过程。通过强化学习,ChatGPT不断地提高自己与人类沟通的能力,为用户提供更准确、更有价值的信息和建议。

如上,学习变得更加简单。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值