信息安全
文章平均质量分 92
像素旅人
我是一名高中生,目前就读于普通高中。我热爱计算机科学领域,对编程和算法有着浓厚的兴趣。在我的课余时间里,我会积极地参加各种编程比赛和活动,以提升自己的技能和素质。
展开
-
BigCode 背后的大规模数据去重
但是,这个经验并不是放之四海而皆准的,如果你准备在自己的数据集上仿效我们的做法,我们建议你在此之前好好检查你的数据集及其特点,然后作出数据驱动的决策。在 BigScience 和 BigCode 项目中,在数据质量方面,我们面临的一个很大的问题是数据重复,这不仅包括训练集内的数据重复,还包括训练集中包含测试基准中的数据从而造成了基准污染 (benchmark contamination)。现在,亲爱的读者,我想与你分享我学到的知识,希望你能透过数据去重的镜头一瞥 BigCode 项目的幕后故事。原创 2023-08-29 15:06:01 · 168 阅读 · 0 评论 -
得物词分发平台技术架构建设与演进
在文章开始前先介绍下导购,导购通常是指帮助消费者在购物过程中做出最佳决策的人或系统。在电商网站中,导购可以引导用户关注热卖商品或促销活动等,帮助用户更好地进行购物。导购的目的是为了提高用户的购物体验,促进销售额的增长。接着开始正文,词分发也属于导购的一部分,他主要提供词推荐相关的功能,比如下拉词、底纹词、榜单、锦囊词、风向标等。而词分发平台则致力于构建一个通用的词推荐平台,避免重复开发和维护成本,提高运营效率和业务灵活性,从而支持公司各个域的业务发展和用户需求。原创 2023-08-29 15:04:46 · 1539 阅读 · 0 评论 -
一条提示词等同于多少个数据点?
通过这项工作,我们研究了一种新的、基于自然语言提示的微调方法,其目的是通过单词预测显式地利用预训练模型的语言建模能力,而不是通过基于模型中间表征的线性分类器隐式地利用它。为了公平比较,我们把问题建模为用反向传播来微调基于提示的分类器语言模型,我们发现提示法通常优于使用标准微调线性分类头的方法。我们用数据点来估计这种优势,以衡量人类通过提示提供的附加信息,并发现编写提示始终抵得上数百个数据点。此外,即使没有言语器带来的信息量(即使用空言语器),这种优势仍然存在,并且这种方法对于提示的选择相当鲁棒。原创 2023-08-29 15:01:39 · 46 阅读 · 0 评论 -
一次网络不通 “争吵” 引发的思考
通过 conntrack 表可以到,这是由于在 cn-hongkong.10.0.5.168 节点上,相关的链路被 dnat,最后是由 pod cn-hongkong.10.0.2.77 节点上的 nginx-79fc6bc6d-8vctc 10.0.2.78 返回源,源在接受这个链路后,会发现和自己的五元组不匹配,直接丢弃,三次握手必然失败,所以建连失败。通过 conntrack 表可以到,在没有 ep 的节点访问 SLB 的 IP,可以看到期望的是后端 pod 返回给 SLB IP。原创 2023-08-16 21:41:13 · 243 阅读 · 0 评论 -
安全测试之探索 windows 游戏扫雷
扫雷游戏相信很多人都从小玩过,在那个电脑游戏并不多的时代,扫雷成为玩的热度蛮高的一款游戏之一,然而就在有一次,接触到了一次不寻常的扫雷过程,使得后来我也有了这个冲动,也来做一次。通过动态调试,逆向和 C 来写一个扫雷辅助工具从而提高逆向与编码技能。原创 2023-07-24 15:21:35 · 191 阅读 · 0 评论 -
2023 年最具威胁的 25 种安全漏洞 (CWE TOP 25)
CWE Top 25 是通过分析美国国家漏洞数据库 (NVD) 中的公共漏洞数据来计算的,以获取前两个日历年 CWE 弱点的根本原因映射原创 2023-07-14 15:58:44 · 482 阅读 · 0 评论