UQI-LIUWJ
码龄7年
关注
提问 私信
  • 博客:2,512,238
    社区:186
    问答:30
    2,512,454
    总访问量
  • 1,520
    原创
  • 938
    排名
  • 3,335
    粉丝
  • 86
    铁粉
  • 学习成就
IP属地以运营商信息为准,境内显示到省(区、市),境外显示到国家(地区)
IP 属地:新加坡
  • 加入CSDN时间: 2017-09-12
博客简介:

qq_40206371的博客

查看详细资料
  • 原力等级
    成就
    当前等级
    9
    当前总分
    15,005
    当月
    324
个人成就
  • 获得5,089次点赞
  • 内容获得827次评论
  • 获得13,649次收藏
  • 代码片获得27,567次分享
创作历程
  • 341篇
    2024年
  • 391篇
    2023年
  • 251篇
    2022年
  • 555篇
    2021年
成就勋章
TA的专栏
  • 论文笔记
    320篇
  • 各专栏目录
    32篇
  • 科研
    21篇
  • 数据集
    39篇
  • NTU课程
    54篇
  • Typescript & JavaScript & HTML
    13篇
  • 讲座笔记
    5篇
  • 地理
    4篇
  • Julia
    8篇
  • SG
  • 计算机其他
    17篇
  • 线性代数
    24篇
  • 强化学习
    58篇
  • C#笔记
    1篇
  • R
    10篇
  • NLP
    2篇
  • NTU
    7篇
  • siren
  • python库整理
    331篇
  • GNN
    9篇
  • 其他
    64篇
  • leetcode
    131篇
  • pytorch学习
    111篇
  • 文计
    7篇
  • 软件使用
    2篇
  • 文件操作
    2篇
  • 算法
    38篇
  • 博弈论
    6篇
  • 机器学习
    153篇
  • 数据库笔记
    3篇
  • 演化学习
    3篇
  • 数学知识整理
    47篇
  • 留学信息
兴趣领域 设置
  • 人工智能
    tensorflowpytorch
创作活动更多

仓颉编程语言体验有奖征文

仓颉编程语言官网已上线,提供版本下载、在线运行、文档体验等功能。为鼓励更多开发者探索仓颉编程语言,现诚邀各位开发者通过官网在线体验/下载使用,参与仓颉体验有奖征文活动。

368人参与 去创作
  • 最近
  • 文章
  • 代码仓
  • 资源
  • 问答
  • 帖子
  • 视频
  • 课程
  • 关注/订阅/互动
  • 收藏
搜TA的内容
搜索 取消

dl笔记:MOE

混合专家模型主要由两个关键部分组成。
原创
发布博客 9 小时前 ·
98 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

论文略读: TransTab: Learning Transferable Tabular Transformers Across Tables

2022 neurips
原创
发布博客 前天 03:35 ·
88 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

论文略读:Quantifying the Knowledge in a DNN to Explain Knowledge Distillation for Classification

2022 TPAMI。
原创
发布博客 2024.12.27 ·
88 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

科研笔记:CCS CONCEPTS

在你选择了所有相关的CCS类别后,该工具会生成一个完整的CCS XML标记,你可以直接复制这段代码并粘贴到你的论文中相应的位置。在CCS工具中,可以通过浏览或搜索相关的关键词来找到与你的研究内容相匹配的主题。
原创
发布博客 2024.12.22 ·
257 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

科研笔记 KDD 2025

KDD 每年有多次投稿周期。KDD 2025 将有两个截止时间:分别是 2024 年 8 月 1 日和 2025 年 2 月 1 日(全文提交截止时间在摘要提交截止后一周)。同时,KDD 会议论文集(Proceedings)将分两批出版。对于在 2024 年 8 月提交并被接收的论文,作者必须在版权转让表(rights form)中选择“提前出版”选项,才能将论文收录到第一批会议论文集中。本次会议将在加拿大多伦多召开,预期在 2025 年 8 月举办。
原创
发布博客 2024.12.22 ·
852 阅读 ·
26 点赞 ·
0 评论 ·
12 收藏

datasets笔记:数据处理

打乱会创建索引映射,可能会降低性能。如果需要恢复性能,可以调用。
原创
发布博客 2024.12.22 ·
217 阅读 ·
9 点赞 ·
0 评论 ·
1 收藏

datasets 笔记: 文本数据集的预处理(Tokenization)

原先的text和label的基础上,多了input_ids,token_type_ids和attention_mask三个key。
原创
发布博客 2024.12.21 ·
265 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

datasets笔记:两种数据集对象

和。
原创
发布博客 2024.12.21 ·
329 阅读 ·
2 点赞 ·
0 评论 ·
3 收藏

datasets 笔记:加载数据集(基本操作)

参考了huggingface的教程。
原创
发布博客 2024.12.21 ·
475 阅读 ·
2 点赞 ·
0 评论 ·
4 收藏

科研笔记:ARR 与 ACL rolling

1 ARR 介绍ARR 提供 评审服务 —— 仅限评审 —— 对于提交的论文。 评审不会针对特定会议/场所,但评审标准与传统会议的主会场长文或短文提交要求相同(如 ACL 或其他由 ACL 主办的重要会议)2提交论文进行 ARR 评审提交截止日期每两个月有一次提交截止日期 若在 截止日期后 48 小时 撤稿,论文将无法在 下一个提交周期 重新提交3 回应评审意见4接收最终评审意见并选择下一步5重新提交论文进行新一轮评审(可选)6
原创
发布博客 2024.12.15 ·
387 阅读 ·
3 点赞 ·
0 评论 ·
2 收藏

论文结论:From Redundancy to Relevance: EnhancingExplainability in Multimodal Large Language Models

在浅层与深层中不同token信息流汇聚情况有所区别 浅层(1-11层)对于图像内容有显著的响应(与提示选项相关的图像区域高亮显示) 模型在理解提示中的上下文、问题和选项后,能过滤并专注于与提示相关的图像内容 在深层(12-32),系统token和用户token的信息流汇聚更为明显,而图像token的汇聚则相对较弱,甚至对输出token没有什么贡献 这些深层可能依赖于浅层收集的信息,并结合LLM的知识,降低了对图像直接关注的依赖。
原创
发布博客 2024.12.13 ·
170 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

论文笔记:Treat Visual Tokens as Text? But Your MLLM Only Needs Fewer Efforts to See

2024 10月的arxiv。
原创
发布博客 2024.12.13 ·
361 阅读 ·
9 点赞 ·
0 评论 ·
1 收藏

论文结论:GPTs and Hallucination Why do large language models hallucinate

GPTs and Hallucination
原创
发布博客 2024.12.12 ·
473 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

GNN笔记:heterophilic图(异配图) 概念部分

参考内容:Mila、麦吉尔等发布异配图学习手册:关于异配图学习的全部重点都在这里了
原创
发布博客 2024.12.10 ·
216 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

深度学习结论:模型架构和神经网络宽度深度的关系

在模型架构设计中,更宽且更浅的神经网络拥有更好的记忆能力,而更深且更瘦的网络则呈现出更强的推理能力。
原创
发布博客 2024.12.10 ·
320 阅读 ·
3 点赞 ·
0 评论 ·
0 收藏

论文略读:LLMs+Persona-Plug = Personalized LLMs

24年9月的arxiv。
原创
发布博客 2024.12.03 ·
149 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

python库笔记 brokenaxes,在坐标轴上创建断裂效果

定义 x 轴的多个区间范围,用于指定哪些部分显示,哪些部分被跳过。:定义 y 轴的多个区间范围,用于显示特定的 y 轴范围。:设置 y 轴的断裂间距,调整断裂之间的距离。:设置 x 轴的断裂间距,调整断裂之间的距离。:列表或元组的列表,例如。:列表或元组的列表,例如。
原创
发布博客 2024.11.16 ·
193 阅读 ·
3 点赞 ·
0 评论 ·
4 收藏

模型运行速度笔记: s/epoch VS s/iter

比如我training set 样本数是10000,batch size是100,一个epoch的时间是300秒。
原创
发布博客 2024.11.15 ·
313 阅读 ·
1 点赞 ·
0 评论 ·
0 收藏

debug笔记:gpustat显示没有进程运行,但是GPU显存被占用

使用gpustat之后,虽然显示除了gpu5之外别的都没有进程,但是GPU显存却被占用了。
原创
发布博客 2024.11.15 ·
258 阅读 ·
2 点赞 ·
0 评论 ·
0 收藏

论文略读: ALPAGASUS: TRAINING A BETTER ALPACA WITH FEWER DATA

ICLR 2024。
原创
发布博客 2024.11.12 ·
279 阅读 ·
8 点赞 ·
0 评论 ·
2 收藏
加载更多