- 博客(110)
- 收藏
- 关注
原创 【科研】想学习的琐碎知识点-不断更新
本摘要总结了近期指代消解模型的主要技术进展:1)采用稀疏注意力机制(LongFormer)降低内存消耗;2)引入多专家打分机制提升精度;3)提出增量处理框架模拟人类阅读模式;4)通过知识蒸馏实现29倍加速(精度损失仅1%),并创新性采用硬标签蒸馏提升稳定性;5)设计余量批处理机制将padding计算从34.7%降至0.6%。这些方法在保持模型性能的同时,显著提升了计算效率和实用性,包括稀疏化处理、动态推理和高效训练等关键技术突破。
2025-10-30 17:47:11
442
原创 【论文阅读】图数据库 Survey: Graph Databases
本文对图数据库技术进行了系统性综述,重点介绍了图数据模型、查询语言和存储架构等核心内容。文章指出,当前图数据库面临数据结构不规则、查询效率低和分布式事务复杂等挑战,并对比分析了属性图(Property Graph)和RDF(Resource Description Framework)两种主流数据模型的特点。在查询语言方面,详细探讨了Cypher、Gremlin、SPARQL和GraphQL四种语言的适用场景及优劣。最后,作者通过多维度比较不同图数据库系统的架构特点,为技术选型提供了参考依据。
2025-10-27 12:45:57
1181
原创 【知识点】API原理到应用
本文介绍了如何使用Flask框架封装API。首先讲解了必备背景知识:Flask作为Python轻量级Web框架,Base64编码用于二进制数据文本化传输,以及curl命令行HTTP工具。接着解释了API的概念和工作原理,包括HTTP请求/响应的组成结构和常见方法。重点对比了原生HTTP服务器实现的复杂性与Flask的简洁性,展示了Flask自动处理HTTP细节的优势。最后通过实战演示了API封装步骤:从安装Flask、创建基础接口、接收JSON参数到完整项目结构。示例代码清晰展示了如何定义路由、处理请求和返
2025-10-24 19:33:39
765
2
原创 【知识点】矢量检索Vector Retrieva 入门
Vector RAG(向量检索增强生成)是一种结合语义向量检索与大语言模型生成能力的智能问答方法。它通过将文档和用户查询嵌入为向量,利用向量数据库进行相似度检索,并将检索结果注入Prompt中供LLM生成回答,解决了传统LLM知识静态、无法访问私有数据等问题。其核心组件包括Embedding模型、向量数据库和检索模块。优势在于语义理解强、知识可动态更新、成本低且可解释性强,但也存在检索依赖严重、上下文窗口限制等缺点。典型应用场景包括企业知识问答、专业领域咨询等,已被OpenAI、Meta等公司采用。类似技术
2025-10-22 14:10:22
905
原创 牛客周赛 Round 50_D小红的因式分解
当时做的时候还以为什么高级算法原来是纯暴力将用到的公式进行展开,在纸上写一写,思路就出来了想不出来,就纯暴力,再优化。
2024-07-18 15:16:57
443
原创 【Codeforces】Round 957 (Div. 3)_B. Angry Monk
认为这种题比较抽象,想不到他这种解法将复杂的问题简单化贪心算法,取局部最优,从而实现整体最优。
2024-07-18 12:17:47
928
原创 【PTA天梯赛】L1-006 连续因子(20分)
真烧脑,断断续续做了一天刚开始题目就理解错了,就开始写题连续因子的求解get到了=0;j++){ //求连续因数temp/=j;cnt++;cnt初始化是0求因子用sqrt(n)提高效率,防止超时。
2024-07-11 01:35:39
1527
1
原创 【PTA天梯赛】L1-008 求整数段和(10分)
没有丝毫技术含量但是需要记忆各种格式化输出【基本功】以下就记 printf 了 cout太难记了,有能用的就行1.转换说明符%a(%A) 浮点数、十六进制数字和p-(P-)记数法(C99)%c 字符%d 有符号十进制整数%f 浮点数(包括float和double)%e(%E) 浮点数指数输出[e-(E-)记数法]%g(%G) 浮点数不显无意义的零"0"
2024-07-10 14:25:01
357
原创 【PTA天梯赛】L1-005 考试座位号(15分)
结构体typedef 不能和结构体数组同时定义数组下标要与题目一致,否则-1或+1段错误,id不能用int 要用string。
2024-07-10 13:14:47
497
原创 【PTA天梯赛】L1-003 个位数统计(15分)
段错误的情况(1)数组越界,在这个题的for循环条件中,i++就出来段错误(2) scanf错误的情况,检查,或换成cout大数字的情况一开始int -> long long ->string对于数据类型的范围不太清楚如果提到几位长的数就是用string 敏感点。
2024-07-10 00:43:27
769
原创 【PTA天梯赛】L1-002 打印沙漏 (20 分)
对照输出进行调bug,特别注重边界情况try1和题解在求层数的不同我自己是暴力遍历求解高手是运用等差数列和公式进行多找规律,尝试运用公式求解。
2024-07-10 00:12:47
488
原创 【算法】什么是离散化
离散化,本质上是一种哈希,它在保持原序列大小关系的前提下把其映射成正整数。它可以有效的降低时间复杂度。离散化可以改进一个低效的算法,甚至实现根本不可能实现的算法。
2023-05-06 10:34:39
2367
3
原创 蓝桥杯刷题冲刺 | 倒计时4天
蓝桥杯刷题冲刺,整除序列(水题)、走方格(dfs vs 记忆化搜索)、前缀和模板、差分模板、翻硬币(递推)。主要是复习,各种模板,之前都忘光了
2023-04-03 23:30:24
1503
3
原创 蓝桥杯刷题冲刺 | 倒计时12天
蓝桥杯刷题冲刺,今天三道题:饮料换购——简单题;受伤的皇后——接近模板题,DFS;超级质数——思维题||暴力,可以收获 string 的函数+ 取一个字符串的全部子串
2023-03-27 22:08:18
457
2
原创 蓝桥杯刷题冲刺 | 倒计时14天
蓝桥杯刷题冲刺,今天5道题:最长递增(双指针)、走迷宫(BFS)、解立方根(浮点数二分)、回文特判(reverse 函数)、修改数组(并查集)
2023-03-25 21:51:59
2496
3
四种算法学习(适用于算法初学者)
2023-02-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅