AI 时代,我们能为数字生命做些什么?

DeepSeek-R1 的发布引发了世界的广泛关注。在深入体验、了解了DeepSeek-R1之后,它的几个特点引发了我的兴趣——能否借助 DeepSeek-R1 构建一个自己的数字生命?

“数字生命”的核心愿景可以概括为:将人类的思想、记忆、人格等核心特质转化为可存储、运行甚至进化的数字形态,使其突破生物寿命的限制。

在使用过 DeepSeek-R1 之后,其所具有的几个特点让我看到了数字生命的希望。

  1. 有“人情味”的回答。DeepSeek-R1 的回答远远超过了以往大语言模型的“AI 味”回答,具有丰富的语气、生动的比喻,甚至懂得暗喻。因此,用 DeepSeek-R1 模型作为数字生命的基石,或许能让最后的成品更加像“人”,更能够承载生命的意义。
  2. 相对较低的成本。虽然没有确切的证据进行计算,但根据网络上的公开信息进行估算,DeepSeek-R1 模型的训练成本可能只有 OpenAI-o1 模型训练成本的几分之一到十几分之一。只有降低成本,数字生命才能够走入每一个人的生活当中。

那么,我们想要构建自己的数字生命,或者为在未来构建自己的数字生命做准备,需要做些什么呢?

核心:准备大量的数据

准备大量的数据这一步,可能是我们构建自己数字生命最重要的一步。不管是直接用数据训练大语言模型,还是通过 RAG 等方式构建应用,数据都是越多越好。只有数据量足够庞大,才能让模型足够“了解你”,乃至于成为你的数字生命。

具体到积累数据的途径,我有以下几个建议:

  1. 每天撰写自己的日记。通过日记积累训练 AI 的数据,可能是最“正经”的一种途径。通过将自己的每天经历的事、见过的人、产生的想法通过文字记录下来,是一种很好的积累个人数据的途径。在做这件事时有一些小 Tips 可以提供:
    1. 使用纯文本(.txt)或者 markdown(.md)格式作为日记格式。这些格式能够轻松的被各种文档加载器读取,省去了未来很多数据处理的工作。
    2. 借助语音输入等方式提高效率。积累用于制作数字生命的数据需要用户尽量事无巨细的记录自己的人生,面对这么大的工作量,码字总归是慢了点。因此通过语音输入,想起什么说什么,能够尽量高效的记录大量细节。
    3. 穿插图片、视频、音频等多模态数据。
  2. 利用网络平台的大量数据。例如微信聊天记录、网购平台的购物记录、社交平台上所发布的内容,这些都是重要的数据。请保留好这些数据,不要删除,尽量做好备份,在未来可能会派上用场。
  3. 通过各种硬件设备进行记录。例如通过拍摄眼镜在日常生活中拍摄一些视频片段,通过健康穿戴设备记录自己的睡眠、心跳等数据。
  4. 撰写个人回忆录。将以往生活中的事情也通过文字记录下来。内容中除了生平经历,还可以事无巨细的记录下自己的感受、想法等。还可以将自己的专业知识、作品、工作成果等内容也记录留存下来。
  5. 保存通话记录。很多安卓手机有通话自动录音功能。

总之,一切“与你有关”的数据都将是有用的数据。无论是文字、图片、视频、音频,都将为未来的数字生命添砖加瓦。

数据的积累将是一场持久战。因此,只有从现在开始做起,才能在未来当技术完全成熟、成本下降到大部分人都可以接受的时候顺利的构建自己的数字生命。TB 乃至 PB 级别的数据不是一朝一夕能够产生的。

当属于自己的模型训练成功后,选择将自己的模型上传到开源平台,自此,你的思想将会永远活在互联网上。或许几十年后,一个年轻人在开源平台上读到了概括了你一生的 readme 文件,对你很感兴趣,于是下载、部署,一场跨越时空的对话就此展开。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值