写在前面
第一篇csdn博客,打算用我喜欢的仿宋(中文)字体与Candara(英文)字体开始这个平台上的博客。发现博客可以通过markdown(md)写真是非常开心,因为习惯的github page和notion也都是md呢。
动机
本来是要测试一下这篇博文的方法是否好使的(感谢该博主提供的方法),还要写点儿什么呢?说说动机叭。昨天与cq聊到做自己的内容平台,写一些论文的随笔或任何事物的笔记,然后做成公众号,这样可以从“身边”的人开始有观众,培养一种习惯、兴趣,甚至未来的副业。不过公众号的排版还挺麻烦的,至少我在20年左右自己做过一个展示自己录制的吉他指弹视频时候如是觉得,又偶然进入到csdn的文章撰写页,觉得设计非常人性化(这种认知仅仅发生在刚才1小时以内),遂打算先以csdn为“公开”笔记的笔记本叭。希望能逐渐养成这种记录的习惯。如果你也有内容创作的意图,也可以以csdn为起点哦,我想这里不只是一个计算机技术的博客平台!周末,打算推动小喵也来这儿记录生活:P
最近在读
最近,除了逐渐熟练起大语言模型相关的基础技术外,也会尝试多读读下面这类关于事实知识学习(factual knowledge learning)、后训练(post-training)、数据选择、数据合成的文章(持续更新的列表在这里),希望这周能完成下述列表中文章的笔记叭。
- Studying Large Language Model Behaviors Under Realistic Knowledge Conflicts, arXiv Apr. 24 2024.
- Understanding Finetuning for Factual Knowledge Extraction, arXiv Jun. 20 2024.
- How Do Large Language Models Acquire Factual Knowledge During Pretraining?, arXiv Jun. 17 2024.