科研笔记与实践
文章平均质量分 93
随笔记录&知识整理
分享科研过程中的笔记和实践经验,包括机器学习、数据挖掘和密码学等领域。本专栏适合渴望将理论知识应用于实践的科研人员。
是Yu欸
这里是我读博期间的笔记本,记录学习和成长,争取顺利毕业ing
展开
-
【科研】8投稿攻略:超越SOTA,从优秀的Motivation开始
Motivation 是论文中用来说明“为什么要研究这个问题”的部分。问题的重要性:为什么这个问题值得解决?现有方法的局限性:为什么现有工作无法有效解决?本文的创新点:你的方法如何弥补现有不足?简而言之,Motivation 的目标是引导读者认同你的研究方向,并对你的方法产生兴趣。Motivation 是论文的第一印象,也是评审决定是否深入阅读的重要依据。通过真实场景引入问题、指出现有工作的不足、明确创新点的贡献,并结合逻辑性和数据支持,您可以打造一篇真正打动评审的高质量论文。原创 2024-11-22 09:16:23 · 1116 阅读 · 0 评论 -
【科研】7学术论文的撰写核心:逻辑严谨与方法阐述的平衡
感谢师兄和学长的帮助,论文前后的三版本能感觉到论文的进步。特此记录过程中的感悟,方便下次论文写作时找到这种感觉。在学术论文写作中,逻辑性是文章的灵魂。论文的每个章节、段落、甚至句子,都应追求一一对应的连贯性,就像写小说一样:**前文埋下的“伏笔”必须在后文呼应**。如果前后脱节,不仅会让读者迷惑,还可能大幅降低论文的说服力。引言和方法部分是决定论文质量的核心。如何在方法阐述中实现`“简而易懂”`与`“深而扎实”`的平衡,是提升论文中稿率的关键。以下,我们将从逻辑性和方法撰写技巧两方面展开描述。原创 2024-11-22 09:07:05 · 956 阅读 · 0 评论 -
【科研】6从零到一:全面了解学术论文写作技巧
学术论文是科研工作的重要产出,也是研究者向学术界传递创新思想和实验成果的主要方式。然而,写好一篇论文并非易事,特别是对于新手来说,可能面临逻辑混乱、语言生涩、方法描述不清等挑战。本文结合 [CSDN博文](https://blog.csdn.net/qq_46675545/article/details/128879845) 和 [GitHub 项目](https://github.com/MLNLP-World/Paper-Writing-Tips) 的内容,分享一套从准备到成稿的全面写作指南,助您轻松迈原创 2024-11-21 11:31:36 · 671 阅读 · 0 评论 -
【科研】5高效撰写学术论文:从思路到落地的实用技巧
在学术界,撰写一篇高质量的论文是研究工作的核心环节之一。然而,从灵感到成稿的过程中,许多研究者常常面临各种挑战:逻辑不清晰、表达不流畅、思路散乱等。感谢互联网的大佬们,找到了一篇很好的教学仓库,mark一下。这篇博客将结合 GitHub 上的 [Paper Writing Tips 项目]原创 2024-11-21 11:13:36 · 709 阅读 · 0 评论 -
【Github】如何使用Git将本地项目上传到Github
通过以上步骤,你就可以轻松地将本地项目上传到Github。这不仅能帮助你备份代码,还能与他人协作开发。希望这篇教程对你有所帮助!如果有问题,欢迎留言讨论!😊hello,我是。原创 2024-11-20 12:24:34 · 806 阅读 · 2 评论 -
【README】如何写出一份优秀的 README 文件:完整指南
在 README 的开头明确项目名称,并简要介绍项目的功能和目的,让用户快速了解项目。# 项目名称项目简介:通过 [方法/技术] 实现 [核心功能],适用于 [使用场景]。一份优秀的 README 文件不仅可以快速传达项目价值,还能大幅提升用户的使用体验和项目的曝光率。通过合理的结构设计和 SEO 优化,帮助更多用户发现和使用你的项目。快行动起来,为你的项目打造一份高质量的 README 文件吧!hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-20 12:12:11 · 1188 阅读 · 0 评论 -
【LaTex】14在.bib文件中,去掉latex论文中没有用到的引用(已排除错误指令)
在 Overleaf 中,虽然没有直接的功能清理.bib文件,但通过bibtool工具、手动筛选或利用本地文献管理工具,可以轻松清理未引用的条目。推荐使用bibtool自动化筛选,这样可以更高效地管理.bib文件,确保文献引用的准确性,优化文档编译的性能。对于日常编辑,Overleaf 提供了方便的在线平台,但复杂的.bib文件管理建议在本地工具中完成,然后上传至 Overleaf 项目中进行最终编译。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-11-19 11:25:08 · 1077 阅读 · 0 评论 -
【Word】一键批量引用论文上标——将正文字体改为上标格式
最近在写开题报告,手动插入参考文献,后续将这些引用调整为上标格式好麻烦。一个个修改不仅繁琐,还容易出错。找到了一个简单高效的方法:利用 **Word 的“替换”功能**,一键实现引用批量上标!下面是具体步骤和技巧。原创 2024-11-19 11:23:41 · 794 阅读 · 0 评论 -
【CVPR 2025】4 提交要求
所有作者都应仔细阅读以下政策,这些政策将指导提交和评审流程。如果未能遵守这些政策,可能会导致投稿被拒绝,或者在双重投稿和抄袭的情况下可能会受到额外的制裁。此外,强烈建议作者查阅道德指南、推荐的最佳实践和常见问题解答。原创 2024-10-24 10:56:40 · 2049 阅读 · 2 评论 -
【CVPR2025】3 投稿指南和论文模版
作为计算机视觉领域最具影响力的会议之一,CVPR(Conference on Computer Vision and Pattern Recognition)每年吸引着全球顶尖的研究者和开发者投稿。CVPR 2025 的论文模板有着严格的格式要求,以确保论文的规范性与一致性。本文将为大家详细介绍 CVPR 2025 论文模板的具体要求,从格式设置到提交过程中的注意事项,让您轻松掌握这一模板的要点。本文为此系列的第三篇,将展示各个投稿链接,详细可以该系列的其他文章。如有错漏,欢迎评论区指出。原创 2024-10-24 10:52:40 · 3705 阅读 · 2 评论 -
【深度学习代码调试5】标准化数据集:TensorFlow Datasets (TFDS)自动化数据加载与预处理
是一个为机器学习模型提供标准化数据集的库。它不仅支持 TensorFlow,也可以与其他框架(例如 PyTorch)一起使用。TFDS 提供了一个一致的 API 来访问广泛的标准数据集,同时支持自动下载、预处理和缓存。TFDS 的核心目标是减少数据集准备的繁琐操作,帮助用户专注于模型开发,而不是数据处理。无论是图像、文本、时间序列还是其他类型的数据,TFDS 都可以帮助快速加载和处理。extract_dir='/tmp/tfds_extract', # 数据解压路径。原创 2024-10-24 10:29:52 · 1282 阅读 · 0 评论 -
【CVPR 2025】2 论文模板引言部分详解:如何准备和提交稿件
作为计算机视觉领域最具影响力的会议之一,CVPR(Conference on Computer Vision and Pattern Recognition)每年吸引着全球顶尖的研究者和开发者投稿。CVPR 2025 的论文模板有着严格的格式要求,以确保论文的规范性与一致性。本文将为大家详细介绍 CVPR 2025 论文模板的具体要求,从格式设置到提交过程中的注意事项,让您轻松掌握这一模板的要点。本文为此系列的第二篇,将展示论文模板中的引言部分,详细可以该系列的其他文章。如有错漏,欢迎评论区指出。原创 2024-10-24 10:17:01 · 1128 阅读 · 0 评论 -
【CVPR 2025】1 论文模板中文版详细指南:从格式到提交要求
摘要标题“Abstract”应为 12 磅的 Times 粗体,并相对于列居中。摘要内容为 10 磅,单倍行距,完全对齐,位于左栏的顶部。摘要和正文之间需要留出两行空白。摘要部分的简洁和清晰是让审稿人快速了解您研究内容的关键,因此严格遵守模板要求至关重要。CVPR 2025 论文模板的格式要求非常严格,确保所有投稿的论文都有统一的外观和结构。遵循这些要求不仅能提升论文的专业度,还能减少因格式问题带来的不必要麻烦。无论是页面设置、字体选择,还是数学公式的编号与引用,所有细节都至关重要。原创 2024-10-24 10:15:47 · 4373 阅读 · 7 评论 -
【深度学习代码调试1】环境配置篇(上) -- 安装PyTorch(安利方法:移除所有国内源,使用默认源)
如果之前添加了非官方源(如清华大学镜像源),可能会导致安装冲突或失败。这将从Conda配置中移除所有自定义的频道设置,使Conda恢复为默认配置。安装深度学习框架时,常常会遇到版本不兼容、依赖库冲突等问题。通过合理选择安装源、升级相关库,通常可以解决大部分问题。希望本文的记录能帮助大家顺利完成环境配置,并避免常见的坑。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-16 22:00:19 · 1456 阅读 · 0 评论 -
【深度学习代码调试2】环境配置篇(中) -- 列出conda环境中所有env的pytorch版本
通过上述步骤,您可以手动或自动检查所有 Conda 环境中的 PyTorch 版本,特别是能够重点标注的环境。这对于管理多个虚拟环境并确保某些关键版本的依赖性非常有帮助。版权声明:本文为原创,遵循协议。转载请注明出处。hello,我是是Yu欸。原文链接 👉 ,⚡️更新更及时。欢迎大家添加好友交流。原创 2024-10-16 22:00:45 · 1250 阅读 · 0 评论 -
【知识图谱】探索攻略:基础、构建、高级应用与相关论文方向
知识图谱(Knowledge Graph,简称KG)是一个旨在以结构化的形式表示知识的工具。它通过节点和边的方式将信息表示出来,节点代表实体(如人、地点、事件等),边则表示实体之间的关系。知识图谱的目的是将零散的信息组织起来,使其变得更加易于理解和利用。原创 2024-05-23 13:58:38 · 2831 阅读 · 69 评论 -
快速入门深度学习9.1(用时20min)——GRU
8节 和 9节 中,循环神经网络(recurrent neural network,`RNN`),这是⼀种利用数据中的`时间或序列结构`的模型,通常用于自然语言处理和时间序列预测。10节 中,`注意力机制`的技术,最近它们已经开始在自然语言处理中取代循环神经网络。这一部分将 帮助读者快速了解大多数现代深度学习应用背后的基本工具。原创 2024-04-14 22:23:49 · 1108 阅读 · 4 评论 -
【笔记】探索生成范式:大型语言模型在信息提取中的作用
信息抽取(Information Extraction, IE)旨在从自然语言文本中提取结构化知识,如实体、关系、事件等。随着生成式大型语言模型(Large Language Models, LLM)在文本理解和生成领域展现出卓越能力,其在跨领域和跨任务泛化中的潜力受到广泛关注。近期,众多研究致力于利用LLM的能力,为IE任务提出基于生成范式的解决方案。因此,研究计划对LLM在IE任务中的应用进行全面和系统性的回顾与探索,综述了该领域的最新进展。原创 2024-04-13 18:35:29 · 5229 阅读 · 26 评论 -
【威胁情报综述阅读3】Cyber Threat Intelligence Mining for Proactive Cybersecurity Defense
在 2020 年代 COVID 驱动的社会、经济和技术变革造成大规模破坏之后,网络安全对手已经改进了他们的交易技巧,使其变得更加复杂。一系列备受瞩目的攻击接踵而至,例如SolarWinds供应链攻击[1],它震撼了许多组织,标志着网络安全的转折点。作为收集、处理和分析有关威胁行为者动机、目标和攻击行为的信息的过程,网络威胁情报 (CTI) 帮助组织、政府和个人互联网用户做出更快、更明智、数据支持的安全决策并改变他们的行为,以对抗威胁行为者从被动到主动。CTI 有几种定义。原创 2024-04-02 15:43:46 · 6601 阅读 · 9 评论 -
四年旅程,一路成长——小雨的创作纪念日
🌈 你好呀,我是小雨,一个充满好奇心的ENFP,正在不断提升能力以满足前者。🌌 2024每日百字篆刻时光,感谢你的陪伴和支持! 🌟 争取每周二开展粉丝福利送书活动,欢迎关注 ~🚀 定期自动回三,欢迎加好友互动 ~ 私信说一下噢可在专栏中快速找到:【网络安全】AIGC最新论文、现代密码、量子通信【快速实战】Python、图像分类、文本摘要原创 2024-04-01 13:14:06 · 10624 阅读 · 120 评论 -
【LaTeX】7实现章节跳转
LaTeX 的hyperref包提供了一个强大的工具集,用于在科研文档中创建和管理超链接。通过简单的步骤,即使是科研新手也能轻松实现文档内的章节跳转,从而提升读者的阅读体验。随着你对 LaTeX 的进一步学习,你将发现更多高级功能,以支持你的科研写作需求。原创 2024-03-27 20:48:13 · 3452 阅读 · 15 评论 -
【ACL 2023-NER注入到PLM】数据集+实验解读:基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognitio
论文:Learning In-context Learning for Named Entity Recognition标题:基于上下文学习的命名实体识别作者:Jiawei Chen, Yaojie Lu, Hongyu Lin, Jie Lou, Wei Jia, Dai Dai, Hua Wu, Boxi Cao, Xianpei Han and Le Sun地址:[\[2305.11038\] Learning In-context Learning for Named Entity Recog原创 2024-03-21 20:04:17 · 7065 阅读 · 36 评论 -
【ACL 2023-NER注入到PLM】基于上下文学习的命名实体识别 Learning In-context Learning for Named Entity Recognition
在这个实例中,我们看到上面两个文本被作为了元函数进行训练,分别得出的函数是文本的分类为{疾病,病毒}和{电影}。下文中我们认为目标是在文本中找到有{疾病,病毒}属性的文本,最终经过PLM得出SARS-CoV-2是一种病毒. COVID-19 是一种疾病。首先我们看到,蓝色的方框中为微调过的函数,这时我们认为微调过的函数取得了最好的结果,也就是预测准确度非常高。原创 2024-03-20 12:00:45 · 7287 阅读 · 31 评论 -
【ACL 2023获奖论文】再现奖:Do CoNLL-2003 Named Entity Taggers Still Work Well in 2023?
该研究提供了对NER模型泛化能力深入的理解,特别是在长时间跨度下的性能变化。通过创建CoNLL++测试集和对多个模型的评估,揭示了时间漂移对模型性能的影响及其与过拟合无关。此外,研究还强调了模型架构、参数规模、预训练数据的时效性和微调数据量在模型泛化中的重要性。这些发现不仅为未来NER模型的开发提供了宝贵的见解,也对如何评估模型在面对新兴数据时的适应性提供了新的视角。原创 2024-03-19 15:27:58 · 10029 阅读 · 4 评论 -
一文速通半监督学习(Semi-supervised Learning):桥接有标签与无标签数据
论文看到哪学到哪 ^ - ^在机器学习的世界里,我们通常遇到这样一个现实问题:标注数据(有标签的数据)往往昂贵且难以获得,而未标注数据(无标签的数据)却大量存在,易于收集。假设你正在尝试教会计算机区分猫和狗的照片,但只有少数照片是打上了“猫”或“狗”的标签,大部分照片都没有标签。这时候,半监督学习就闪亮登场了,它是一种使用大量未标注数据和少量标注数据进行学习的方法,旨在提高学习效率和准确性。原创 2024-03-18 21:16:36 · 5600 阅读 · 26 评论 -
【相关问题解答2】bert中文文本摘要代码:结果输出为一些重复的标点符号和数字
感谢大家的支持和关注。最近好多人咨询之前博客【bert中文文本摘要代码】的相关代码报错问题,由于报错有一定的相似性,因此这里统一进行答复原创 2024-03-13 16:00:34 · 6597 阅读 · 20 评论 -
【相关问题解答1】bert中文文本摘要代码:import时无法找到包时,几个潜在的原因和解决方法
感谢大家的支持和关注。最近好多人咨询之前博客【bert中文文本摘要代码】的相关代码报错问题,由于报错有一定的相似性,因此这里统一进行答复原创 2024-03-13 15:56:39 · 6675 阅读 · 15 评论 -
【威胁情报综述阅读2】综述:高级持续性威胁智能分析技术 Advanced Persistent Threat intelligent profiling technique: A survey
随着互联网和信息技术的蓬勃发展,网络攻击变得越来越频繁和复杂,尤其是高级持续威胁 (APT) 攻击。与传统攻击不同,APT 攻击更具针对性、隐蔽性和对抗性,因此手动分析威胁行为以进行 APT 检测、归因和响应具有挑战性。因此,研究界一直专注于智能防御方法。智能威胁分析致力于通过知识图谱和深度学习方法分析APT攻击并提高防御能力。基于这一见解,本文首次系统回顾了针对 APT 攻击的智能威胁分析技术,涵盖数据、方法和应用三个方面。内容包括数据处理技术、威胁建模、表示、推理方法等。原创 2024-03-12 13:23:41 · 7136 阅读 · 22 评论 -
【威胁情报挖掘-论文阅读】学习图表绘制 基于多实例学习的网络行为提取 SeqMask: Behavior Extraction Over Cyber Threat Intelligence
虽然上述方法可以定位或识别CTI中的一些TTPs信息,但需要解决以下问题。基于机器学习的方法由于其黑盒性质而难以有效定位 TTP,导致无法形成 TTP 实体。信息提取方法的局限性可分为三点。(1)数据不足:信息提取的核心是实现对SVO/VO行为短语的提取,这将过滤非SVO/VO信息,使部分证据丢失。识别的结果只能判断行为的归属,但很难定位和推理预测。(2)验证不完全:信息提取擅长区分行为短语之间的相似性,但不能区分短语中单个单词的贡献。识别方法只能确定分类的准确性,因此难以理解输入文本导致结果的原因或方式。原创 2024-03-12 13:10:14 · 6398 阅读 · 26 评论 -
【word】论文、报告:①插入图表题注,交叉引用②快速插入图表目录③删改后一键更新
在创建报告、论文或其他文档时,经常需要插入图表,并对其进行标号、添加题注以及在文档中进行引用。同时,要确保在文档末尾或需要的地方能够生成图表目录,以便读者可以快速找到所需的图表。本文将介绍如何在Microsoft Word中实现这些功能:`如何针对图表插入题注、交叉引用,且后续快速插入图表目录?`,确保图表管理更加高效。原创 2024-01-27 21:22:08 · 11962 阅读 · 73 评论 -
【word visio绘图】关闭visio两线交叉的跳线(跨线)
如何在Visio绘图中关闭visio两线交叉的跳线(跨线)原创 2024-01-27 21:21:54 · 5039 阅读 · 7 评论 -
【论文代码】① STIOCS: Active learning-based semi-supervised training framework for IOC extraction
论文 [STIOCS: Active learning-based semi-supervised training framework for IOC extraction](https://www.sciencedirect.com/science/article/pii/S0045790623004056)代码解读:[https://github.com/MuscleFish/SeqMask](https://github.com/MuscleFish/SeqMask).原创 2024-01-26 16:06:09 · 984 阅读 · 5 评论 -
【LaTeX】6在Overleaf的IEEE会议模板中,快速插入参考文献
在学术写作中,准确且高效地管理文献引用是至关重要的。LaTeX结合BibTex提供了一个强大的解决方案,尤其是在使用Overleaf这样的在线LaTeX编辑器时。本文旨在全面介绍如何在Overleaf平台上使用IEEE会议模板,结合LaTeX和BibTex进行文献管理和引用。原创 2024-01-24 17:25:53 · 5932 阅读 · 46 评论 -
【LaTeX】5报错解决汇总
【latex】报错解决汇总原创 2024-01-24 17:17:39 · 2994 阅读 · 2 评论 -
【LaTeX】4参考文献排版前移,在最前面引用\usepackage{url}
文件中第120行对应的条目,并检查是否有任何特殊字符或数学表达式没有被正确地包含在数学模式中。如果是URL中的下划线,通常URL不需要放在数学模式中,因此您应该使用。例如,如果您有一个URL或其他字段中的下划线,并且没有被正确地处理,它将触发这个错误。可能是引用中包含了应该在数学模式中的字符,比如希腊字母或数学运算符,但没有被正确地包围在数学模式中。文件的第120行遇到了需要处于数学模式中的字符或表达式,但没有被正确地包围在数学模式定界符(最后真是url的问题,学习到了申申解决问题的逻辑,感觉好丝滑。原创 2024-01-17 16:26:05 · 3499 阅读 · 37 评论 -
现代密码学 考点汇总(下)
字数超了判断方式:要么证明是cca安全(通过规约),要么找一个攻击方式去攻击一样一个题1、对称加密、2、消息认证码MAC3、哈希函数、4、非对称的多样加密的方案【数字签名不考,因为和mac功能和证明方式、实验都类似】随机预言机性质、随机预言机模型之下的简单应用性质之下构造函数的性质MAC的词法(Message Authentication Code)MAC安全定义MAC安全PPT在密码学中代表“概率多项式时间”(Probabilistic Polynomial Time),这是一种衡量算法或攻原创 2024-01-17 16:25:07 · 2522 阅读 · 3 评论 -
【LaTeX】3在Overleaf中解决IEEE LaTeX模板不能显示中文问题
CTeX是一个针对中文排版优化的LaTeX宏集,它提供了完善的中文支持,包括字体选择、文本排版、以及和其他宏包的兼容性。在开始解决方案之前,确保你的Overleaf项目设置正确,特别是编译器选择(例如XeLaTeX或LuaLaTeX),这些编译器天然支持UTF-8编码,更适合处理中文。通过以上步骤,可以有效解决在Overleaf中使用IEEE LaTeX模板时的中文显示问题,从而顺利完成中文学术文档的编写和提交。Overleaf默认支持的是英文文档写作,如写的中文“你的名字”,在编译后没有显示出来。原创 2024-01-16 16:34:10 · 8096 阅读 · 55 评论 -
现代密码学 考点汇总(上)
字数超了,只能分为为两部分判断方式:要么证明是cca安全(通过规约),要么找一个攻击方式去攻击一样一个题1、对称加密、2、消息认证码MAC3、哈希函数、4、非对称的多样加密的方案【数字签名不考,因为和mac功能和证明方式、实验都类似】随机预言机性质、随机预言机模型之下的简单应用性质之下构造函数的性质规约证明一个规约法证明PRG的例子假设FFF是PRG,证明GGG也是PRG。问题A:如何区分FFF;问题B:如何区分GGG;从A规约到B:区分FFF的算法输入按位取反后作为区分GGG的算法输入,区分G原创 2024-01-16 16:32:52 · 2605 阅读 · 0 评论 -
【现代密码学】笔记6--伪随机对象的理论构造《introduction to modern cryphtography》
注:核心断言可以理解为根据函数的输出最难推断的关于输入的一个比特信息,任意敌手算法与随机猜测相比几乎没有差异。本节学习如何设计基于单向函数存在的假设从理论上构造PRG、PRF、PRP这三个伪随机对象。来)随机挑选的任意若干比特信息(核心断言),否则意味着敌手可以求出整个。目录:单向函数(One-Way Function),从OWF到PRP。注:这里说明计算不需要用原本的函数,只要结果相同就可以。注:子集和问题判定是否存在一个子集中元素之和为给定的值。中若干比特的信息,但仍不能推断出(由。原创 2024-01-15 16:43:11 · 3908 阅读 · 36 评论 -
【现代密码学】笔记5--伪随机置换(分组加密)《introduction to modern cryphtography》
在已知明文攻击(KPA)下,从输入方向输入一个明文,通过一次DES加密,猜测不同密钥来得到一组中间值,保存这些密钥和中间值对;针对DES的密码学分析的重点是分析S盒,因为S盒是DES中唯一的非线形部分,输入和输出之间关系被有意地设计成难以简单描述;此外,简要介绍当前广泛使用的AES。攻击一个1轮SPN:64比特块,128比特密钥(2个64比特子密钥),16x4比特的S盒,以及用异或来实现密钥混合;根据图中关系可以观察到,根据明文和密文知道的20个比特,密钥中未知的20个比特,以及4个比特来比较;原创 2024-01-15 16:42:52 · 3327 阅读 · 1 评论
分享