- 博客(12)
- 收藏
- 关注
原创 总结-NuerIPS2023-Direct Preference Optimization:Your Language Model is Secretly a Reward Model
对比PPO,DPO的泛化能力更强。
2024-09-27 16:42:12 777
原创 【论文研读&代码复现&简洁代码实现】大模型奠基之作——Transformer
本文主要提出了一个简单网络结构,作者将其命名为Transformer(变形金刚),这个模型只使用注意力机制。
2024-09-26 20:08:04 678
原创 ChatGPT可以语音对话了,那岂不是可以用来练习英语口语!
之前GPT-4推出的时候骄傲宣布,这是一个vision-language Model(VLM),即GPT-4结合了视觉-文本两个模态,用户可以在对话框中上传图片,如:上传2017年考研英语一大作文图文,让GPT-4根据图片写作。4个月前,OpenAI最新发布的GPT-4o又新结合了语音模态,在他们官网的宣传视频中,演示了人类和GPT-4o对话的场景。
2024-09-26 19:29:46 167
原创 【论文研读&代码复现】经典重读!!!AlexNet
本文使用ImageNet数据集训练了一个大型深度卷积神经网络,取得了很好的结果。这个网络包含60,000,000,000个参数和650,000个神经元,由5个卷积层,一些卷积层后跟了池化层,以及3个全连接层组成。为了加速训练,使用了非饱和神经元和GPU。使用Dropout来抑制全连接层的过拟合。
2024-09-26 15:47:59 480
原创 双非跨考二战浙大,初试398遗憾离场
浙大很公平,面试老师很友好,计专每年招的人多,学长学姐的经验贴很全面,浙大QQ群氛围好。这种种的便利都促使每年浙大都能吸引一批大神报考,所以普通人择校还是量力而行吧。
2024-03-30 20:32:17 338 1
原创 SSH代替HTTPS,解决无法连接GitHub远程仓库的问题
在我开了代理,网很好,访问github官网很流畅的情况的下,我用git push上传文件到远程厂库,他还是提醒我无法连接第一次让我输入账户密码,我输了,它提示我输入错误第二次再传就直接无法链接远程仓库了。
2023-05-06 09:17:39 899
原创 【Java原码阅读】——ArrayList数组扩容的底层实现
ArrayList的底层是一个elementData数组,当我们使用ArrayList容器的时候,不用像使用自己定义的数组一样要提前设置数组大小,而是直接调用方法插入删除数据就可以了。这是因为这些ArrayList底层都帮我们实现了。开始时并没有指定数组大小,当调用add()方法时为底层数组开辟大小为10的空间。ArrayList是List接口的子实现,具有线性结构。依次类推,当数组大小超过15时,再次扩容1.5倍…有序(读取顺序和写入顺序完全一致或完全相反)当数组中元素超过10个时,扩容。
2023-04-21 21:16:14 142 1
原创 【面向对象基础】——protected访问权限修饰符
Object类中的有被protected修饰的Clone方法,如果想要实现一个类的Clone就要调用该方法。
2023-04-18 17:36:19 185 1
原创 markdown
什么是Markdown:Markdown是一种轻量级的标记语言为什么要学Markdown:当然是因为它好!在程序员中,md文档已经逐渐有取代传统的Word的趋势,所以想要成为一名合格的程序员,当然要学!学习目的:像熟悉word一样熟悉Markdown语法。
2023-04-16 15:08:54 95 2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人