自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

So_What的博客

分享我的学习经验与心得

  • 博客(8)
  • 收藏
  • 关注

原创 HW13_NetworkCompression_理论部分

定义教师模型的网络结构# 定义学生模型的网络结构在知识蒸馏过程中,我们通常使用一个组合的损失函数,包括传统的交叉熵损失和 KL 散度损失。不同的超参数可以T和alpha可以得到不同的结果,具体超参数的选取要根据实际情况"""计算知识蒸馏的损失函数。:param student_logits: 学生模型的输出:param teacher_logits: 教师模型的输出:param labels: 真实标签:param T: 温度参数:param alpha: 权重参数。

2024-05-29 17:24:12 316

原创 HW13_NetworkCompression_pyotrch部分

是为了确保在使用 CuDNN 后端时,所有操作都使用确定性的算法,从而使得模型在相同输入下每次运行的结果都相同。这对于需要结果一致性的场景非常重要,但可能会带来一些性能上的损失。是为了避免 CuDNN 在每次输入大小变化时都进行基准测试,适用于输入大小不定的场景。结合可以确保结果的确定性和可重复性。

2024-05-29 17:22:43 699

原创 HW4_SelfAttention_python部分

这段代码通过配置tqdm进度条库,为一个循环过程创建了一个进度条对象,方便在终端中直观地显示和监控进度。方法在tqdm进度条中起到更新进度条当前进度的作用。通过在循环或迭代过程中调用它,进度条可以动态地反映当前处理进度,结合其他方法如,可以提供详细的实时状态信息,从而帮助用户更好地监控和管理长时间运行的任务。

2024-05-26 21:21:07 269

原创 HW4_SelfAttention_pytorch部分

提供了一种灵活且强大的方式来调整学习率,通过自定义的lambda函数,可以实现各种复杂的学习率调度策略,从而更好地控制模型的训练过程。是 PyTorch 中获取模型参数的标准方式。它返回一个字典,包含了模型中所有可学习参数(权重和偏置)。通过保存和加载状态字典,可以方便地持久化模型的状态,进行模型的检查和调试,并在不同的训练和推理环境中恢复模型。

2024-05-26 21:19:04 759 1

原创 Huggingface官方文档阅读——Transformers

量化模型配置信息 quantization-BitsAndBytesConfig

2024-05-23 11:33:52 263

原创 git工具使用以及常见代码仓库

在服务器部署django项目之前,我们需要先将代码放在服务器上。一种常见的方法是基于git和代码仓库

2024-05-21 17:57:37 226

原创 django项目线上部署,涉及nginx、uwsgi、mysql

首先激活虚拟环境source /envs/django/bin/activate进入项目文件夹 cd /data/My_Blog启动nginx 如果没有设置开机自启动,systemctl enable nginx启动uwsgi uwsgi --ini myblog_uwsgi.ini总结一些功能nginx用于挡在最外面,它监听http协议的80端口,如果是静态文件则自己处理,如果是python代码则转发给uwsgi。

2024-05-21 16:48:55 912

原创 期末大作业

本项目基于vue框架构建前端页面,项目运行在Ganache生成的私有区块链上,借助truffle框架编写和部署智能合约,最后在前端页面借助MetaMask工具管理不同账户的众筹和投资信息。

2024-05-15 11:21:17 774

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除