为什么需要个人知识库?
大概有很多人跟我一样,被现在信息过载弄得非常焦虑。很自然想到通过整理的方式来对抗信息过载,试图使用各种知识管理工具来整理这些信息,但最后折腾完各种工具后,才发现根本用不起来。因为这些工具常常需要我们按照预设的框架去管理和整理我们的信息,而这些框架可能并不完全符合我们的需求,缺乏足够的灵活性。
所以我在想,是否存在这样一种方案?既不改变我们现有摄入处理信息的方式,又能在整理信息时帮助我们链接和管理我们历史的知识。在大模型语言出现之前,这可能是难以实现的。但现在以 OpenAI 为代表的语言模型,具备了这个能力,他们能非常精准地理解你的自然语言。因此,我们完全可以不必关心整理这一趴,所有的知识点都可以散落一地,我们只在需要它的时候,捡起我想要的。
这么做的好处在于,它可以给你的大脑减负。而那些收藏夹吃灰系列的内容,也有被再度回收利用的可能。总之就是,拿来当第二大脑,真的超级适合!并且,通过提问的方式去使用它也非常符合直觉。另外我在成本上也做了验证,具体步骤在这里👉 ChatGPT 插件做个人知识库的成本计算,3.7K 的中文字数,收了 2 分钱,太良心了好吧?
原理介绍
为了方便之后更好地使用它,我们还是需要提前了解两个基本概念,有技术背景的童鞋可以跳过这一趴
什么是嵌入 (embedding)
简而言之,嵌入就是一个向量,它是可以被机器理解的数字列表。将自然语言映射成这样的向量,可以帮助机器理解词的含义以及词与词之间的关系。