自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(48)
  • 收藏
  • 关注

原创 跨语言指令调优深度探索

在大型语言模型的领域,英文数据由于其广泛的可用性和普遍性,经常被用作训练模型的主要语料。尽管这些模型可能在英文任务中表现出色,但它们在处理非英语任务,尤其是零样本情况下的跨语言任务时,性能如何则尚未得到充分的研究。本文的目标是填补这一研究空白,评估仅用英文数据进行训练和调优的大型语言模型对非英语指令的响应能力。

2024-04-25 22:23:06 682

原创 2024腾讯游戏安全技术竞赛-机器学习赛道

参赛者需要基于英语数据集开发一款跨语言恶意文本识别模型,最终模型将在包含英语、阿语、土语、俄语的测试集上评估效果,并取各语种的 F-score 平均值作为评定最终成绩的依据。比赛提供的数据集:8k 条带标注数据(英语),文件名:train.txt4*20k 条无标注数据(每个语种各 20k),文件名:unlabel_text.txt4*5k 条 ChatGPT 标注数据(每个语种各 5k),文件名:labeled_text_by_ChatGPT.txt。

2024-04-24 23:38:25 584

原创 快速使用 Vision-RWKV 进行图像分类

本仓库是的化简版,只包含图像分类的模型代码.因为有自己的数据集加载和训练代码,所以只需要实例化模型.请不要使用Windows,推荐Ubuntu请使用英伟达显卡。

2024-04-04 11:24:05 370

转载 [高危] XZ-Utils 5.6.0/5.6.1版本后门风险(CVE-2024-3094)

因此您的 sshd 会执行被植入后门的代码。攻击者污染了上游 Git 仓库的 build-to-host.m4 构建脚本和测试用例,在编译期间向 liblzma 注入攻击代码。在 SSH 登录认证时,sshd 会调用该符号,并在服务器上执行攻击代码。如果您的系统使用 systemd 启动 OpenSSH 服务器,您的 SSH 认证过程可能被攻击。来检查 xz 版本,如果输出为 5.6.0 或 5.6.1 ,说明您的系统已被植入后门。符号,并将其指向的地址替换为后门代码。该后门首先在 sshd 启动时替换。

2024-03-30 13:26:08 1592

原创 笔迹/签名数据集汇总

手写签名验证的竞赛 - 在 SVC2004: First international signature verification competition 中,作者描述了自动手写签名验证领域的挑战,并提出了一个签名数据库,涉及在签名收集前的充分练习、更大的样本收集等问题。笔迹和签名识别技术主要依赖于数据驱动的方法,其中,高质量的数据集可以显著提高识别算法的性能。在构建数据集时,研究者面临众多挑战,包括但不限于数据采集的法律和伦理问题、数据预处理和清洗的复杂性,以及更新维护数据集以适应不断变化的技术要求。

2024-03-29 19:52:00 1025

原创 CTF新题型--AI

AI类题目通常涉及到使用或修改AI模型来解决特定的问题。这类题目可能要求选手利用算法对数据进行修改、运算,以实现解题目的.例如,字节跳动安全与风控团队发起的安全AI挑战赛就涵盖了图像文本识别、海量数据分析等方向,而WMCTF2020和TJUCTF新生赛中也有AI相关的题目.在这些题目中,有的是基于神经网络的欺骗AI问题,如通过生成对抗样本来欺骗AI图像识别系统;最近的比赛中又出现了新题型 – AI,在CTF竞赛中引入AI题目,可以测试选手对当前最前沿技术的理解和应用能力.早期题目都比较简单,如欺骗 ai;

2024-03-25 12:06:51 489

原创 CASIA数据集转png HWDB2.0-2.2

离线文本数据库是由孤立字符数据集的作者制作的。(训练集和测试集的作者是互斥的)把原训练集和测试集的数据合并到一个文件夹里,再根据作者重新分配训练集和测试集,确保训练集中存在每一个作者的笔迹.还要把dgrl 转成 png.这里使用简单的方法处理,记录每行添加进大图后的最下边的 y 值,这样虽然上下距离变远了但不影响使用.使用代码导出 png 时,发生了重叠(每行的坐标和长宽使用的是文件里面解析的结果)使用dgrl 查看002-P18.dgrl 是正常的(不会出现上下行重叠)提取结果(保存灰度图和二值图)

2024-03-23 17:22:11 811

原创 科技魔法!阿里通义千问让你跟随音乐摇摆起来!

2024年,一个名叫《科目三》的舞蹈在众多社交平台上火爆开来。它的火爆程度,甚至让一向以科技惊人闻名的亿万富翁马斯克也不得不对其前来“致敬”。然而,学习这种舞蹈却是一项颇具挑战的任务,尤其是对于四肢并非十分协调的人来说。但现在,你不再需要担心无法熟练掌握这种舞蹈的技巧。一款充满黑科技的产品已经到来,并即刻让你变身舞蹈达人。它就是阿里通义千问APP。阿里通义千问APP在2024年新年伊始就宣布推出了一项全新功能:用户只需上传一张照片,就可以生成爆款舞蹈视频。【视频链接】。

2024-02-15 21:26:05 1047

原创 重返信仰之源:树莓派的奇妙历程

众所周知,树莓派在十岁生日的庆典上,已经蜕变为全球首屈一指的微型电脑品牌,为全球的数千万开发者提供了离奇的可能性。充满乐趣和惊喜的名字——“树莓派”,取自各种水果的名字,回顾我们可以找到苹果,杏子和橡子的影子。其中,橡子公司是制造BBC Micro的科技巨头,而这台实体计算机便激发了联合创始人兼首席执行官埃本·厄普顿开启他制造树莓派的历程。此外,厄普顿也曾表示,树莓派的名字是对英国的一种俚语所做的有趣引用。

2024-02-15 20:54:57 846

原创 面对Copilot时代:机遇与挑战的解析

Copilot 是一种AI驱动的代码补全工具,它可以提供代码建议,帮助开发者更快地编写代码。这一工具使用机器学习模型,通过分析海量的代码库学习编程语言的使用模式。面对Copilot时代,开发者及行业需要在享受高效率带来的便利同时,意识到潜在挑战,并积极寻找平衡点,保证软件开发质量与创新的持续性。以上是针对Copilot时代的简要分析,每个角度都有进一步深入讨论的空间,希望能提供给读者在思考新技术冲击下的一些启示。

2024-02-14 12:12:45 1397 1

原创 AI 对齐:深入剖析人工智能伦理和技术标准

人类社会的价值观多样且复杂,如何精确定义AI系统应遵循的价值观是一个基本的挑战。不同的文化和背景可能导致价值观的冲突,而一个全球化的AI系统如何兼顾这些差异是极具挑战性的。AI 对齐是一个多维度、跨学科的复杂议题,它不仅要求技术的进步,也需要社会各界的共同努力和参与。未来的发展方向将围绕如何构建既智能又伦理的人工智能系统展开。

2024-02-14 11:53:23 1165

原创 二元隐式方程(隐函数)图像绘制 [1]

在中学数学中,我们学过描点法绘制f(x)的图像,即给定x,计算对应的函数值,得到坐标(x1,f(x1)),代入多个x即可得到多个该函数上的点,再把这些点依次相连即可画出函数大致图像,当x取值的间隔(步长)越小时,绘制的图像越接近真实图像.在计算机中函数绘图也是应用这种思想,计算的都是离散的值,连续值是不可能实现的.对于显函数y=f(x),直接把x代入计算即可得到函数上某点的坐标.但是对于隐式方程,如sin⁡xy−cos⁡xysin⁡xsinxy−cosxy。

2024-02-11 22:21:44 1051

原创 工业视觉发展历程解析

工业视觉系统指利用摄像机和其他光学元件捕获图像,再通过计算机视觉算法来处理和分析这些图像,从而实现对物体的检测、识别、测量和排序等功能。最早的工业视觉系统可以追溯到20世纪70年代,当时主要用于产品的质量控制,如焊点检测、零件的存在与否检查等。这些系统通常设定有固定的阈值,通过简单的光学元件和模拟信号处理技术对产品进行简单分类。早期工业视觉系统虽然功能有限,但其在自动化生产线上的应用表明了视觉技术在工业自动化进程中的潜在价值。

2024-02-11 19:48:06 880

原创 JPEG图像格式加速神经网络训练--使用DCT训练CNN

构建一个接受DCT系数输入的最简单的示例神经网络通常会从一个基本的卷积神经网络(CNN)开始,其核心功能是识别图像中的模式,即使是在频率域中的模式。需要注意的是,不同的库可能提供不同层次的解析能力。这些DCT系数代表了不同频率的信息,其中的第一个系数(DC系数)代表块的平均亮度,其余的63个系数(AC系数)代表更高频率内容的细节。DCT系数的分布可能会由于图像内容而有很大的变化,要使用机器学习算法,一种可能的预处理步骤是转换DCT系数的分布,让其更接近于正态分布或其他有利于模型学习的分布。

2024-02-10 11:14:52 1853

原创 LLaMA 入门指南

LLaMA(Large Language Model – Meta AI)是一种由Facebook母公司Meta AI提出的大型语言模型。它是设计用来理解和生成自然语言文本的模型。LLaMA通过大规模数据集训练,可以在多种任务中表现出色,包括文本分类、文本生成、问答等。LLaMA(Large Language Model Meta AI)是近年来在自然语言处理和机器学习领域引起广泛关注的模型。其背后的数据集是模型训练成功的关键。以下是LLaMA模型训练中可能涉及到的一些常见数据集类型。

2024-02-08 16:55:30 1902

原创 开源大型语言模型概览:多语种支持与中文专注

大型语言模型是一种基于深度学习的自然语言处理技术,其训练所使用的数据集非常庞大,能够捕获语言的复杂性和多样性。这类模型通常由数以亿计的参数组成,使得它们能够有效地处理、预测和生成自然语言文本。

2024-02-08 15:57:08 1708

原创 CRNN介绍:用于识别图中文本的深度学习模型

在计算机视觉和机器学习的领域中,文本识别是一个重要的研究领域,它旨在从图像中检测和识别文字。CRNN(Convolutional Recurrent Neural Network,卷积递归神经网络)是这个领域内的一个代表性的框架,它融合了卷积神经网络(CNN)和递归神经网络(RNN),特别适用于对图像中的序列文本进行识别。

2024-02-07 20:10:15 2205

原创 物理信息神经网络(PINN): 将物理知识融合到深度学习中

物理信息神经网络(Physics-Informed Neural Networks,简称PINN)是一种结合了深度学习和物理学知识的机器学习模型。与传统的数据驱动的神经网络不同,PINNs 在学习过程中利用物理法则对模型进行指导,从而提高模型泛化能力,特别是在数据较少或噪声较大的情况下。首先,需要明确模型目标及其对应的物理定律。例如,在解决流体力学问题时,可能会涉及到Navier-Stokes方程。模型的建立和训练过程应围绕该物理定律展开。

2024-02-07 19:17:03 8387 7

原创 图像处理入门:OpenCV的基础用法解析

OpenCV(Open Source Computer Vision Library)是一个开源的计算机视觉和机器学习软件库。OpenCV是专为实现高效的视觉处理和实现普及化而设计的,它广泛应用于公司的产品和服务、研究团队和政府部门。

2024-02-07 15:11:34 1204 1

原创 与AI对话:编写高效Prompt的指南

在提问前,对关键词进行明确的定义或描述,以便准确传达其意义和范围。

2024-02-05 10:20:32 1473

原创 精妙绝伦:探秘令人惊叹的代码技巧

编程世界中不乏一些令人惊叹的实践和技巧,这些巧妙的方法不仅展示了编写者高超的编程技能,而且在很多情况下能够提高代码的性能、简化复杂问题的解决方案,甚至以极少的代码实现强大的功能。以下是一些在编程中经常遇到的精妙技巧。

2024-02-05 10:11:18 1134

原创 循环神经网络(RNN)简介与应用

循环神经网络(Recurrent Neural Networks,简称RNN)是深度学习中用于处理序列数据的一类神经网络。本文将介绍RNN的基本概念、原理、以及在不同领域的应用,并附带一些具体的代码实例,以便更好地理解和应用这一强大的序列模型。

2024-02-04 13:11:43 1924 1

原创 PHP入门指南:API

在现代的web开发中,应用程序接口(API)已经成为了连接不同软件服务的桥梁。API让不同的系统之间能够无缝地进行交互,极大地提高了开发的效率与系统的可用性。PHP,作为一门广泛使用的服务器端脚本语言,对于构建和使用API提供了广泛的支持。通过PHP,开发者能够创建能够处理HTTP请求和响应的API,将数据、服务或者功能以标准化的方式暴露给客户端软件,例如移动应用、其他网站或者服务端应用。在本篇文章中,我们将探讨API的基本概念,PHP中API交互的基础知识,以及如何在PHP环境中创建和消费API。

2024-02-04 10:47:50 1034

原创 PHP入门指南:进阶篇

在掌握了PHP的基础知识之后,本文将指导读者继续学习PHP的进阶内容,深化对PHP编程的理解和应用。文中会结合代码示例,帮助读者更好地理解。

2024-02-04 10:21:39 1276

原创 PHP入门指南:起步篇

PHP(Hypertext Preprocessor,超文本预处理器)是专为Web开发设计的语言,也可用作通用编程语言。这种语言可以在HTML代码中嵌入,或者以各种Web模板系统、Web内容管理系统和Web框架的形式使用。它提供了与Web服务器的交互能力,以及读写数据库的功能,从而使得PHP成为构建动态和交互式网站的强大工具。PHP的语法借鉴了C语言、Java和Perl等编程语言的特点,并且其代码执行是在服务器端进行的。

2024-02-03 18:11:05 1182

原创 可解释性AI(XAI):构建透明和值得信赖的决策过程

可解释性AI(XAI)旨在提高人工智能系统的透明度和可理解性,使人们更好地理解AI的决策过程和原理。随着AI技术的广泛应用,XAI成为了一个备受关注的重要领域。它不仅有助于建立人们对AI的信任,还可以帮助解决AI伦理和偏见等问题。XAI的研究和应用涵盖了从算法改进、可视化技术到应用场景等多个方面,为解决复杂问题提供了新的思路和方法。

2024-02-03 10:09:27 848

原创 开源软件:推动技术革新与商业模式转型的引擎

本文将分析开源软件如何推动技术革新、其独特的商业模式运作、面临的安全风险,以及其在未来发展的趋势和在多个行业中的应用案例,从而提供一窗口视角以理解开源软件的全貌。开源软件为全球范围内的开发者提供一个共享、协作的平台,通过开放源代码的方式,降低了创新的门槛。全球的开发者可以轻易地访问、修改和优化代码,这种开放性打破了地理和文化的界限,允许不同背景的人才共同协作,处理复杂的问题,引入新的解决方案。服务与支持模式下,开源软件自身是免费的,但企业为使用该软件的用户提供付费的技术支持、定制开发和咨询服务。

2024-02-02 21:56:28 1129

原创 开放式人工智能:聚焦OpenAI的发展历程

GPT-4的这项创新为人工智能的应用打开了新的维度,例如更紧密结合的人机交互、多模态学习和创作等。随着GPT-4等先进AI模型的进一步开发和普及,可以预见的是,人类的工作和生活方式将会在未来收到深远的影响。作为GPT-3的继承者,GPT-3.5在原有模型基础上进行了优化,在保持了巨大模型规模的同时,增强了其理解和生成能力。在经过几年的运作后,OpenAI进行了组织上的重大调整。GPT-4的核心创新在于其规模更大、更加复杂的模型架构,以及对于多模态输入(例如结合了文本和图像)的理解和响应能力的显著提升。

2024-02-01 13:10:36 924

原创 语义分割:从早期探索到深度学习的突破

2012年的AlexNet的成功带来了深度学习的热潮,紧随其后的,包括但不限于FCN(全卷积网络)和U-Net,为解决更加复杂的图像语义分割问题提供了新思路。DeepLab系列、SegNet以及更多端到端的语义分割框架,通过融合深层的语义信息和浅层的细节信息,不仅在性能上取得了突破,也极大简化了训练流程,并且提高了模型的灵活性。Mask R-CNN[9]是在Faster R-CNN的基础上进一步发展的,它不仅可以进行目标检测,还能输出高质量的分割掩码,实现了检测与分割的多任务学习。

2024-02-01 11:20:53 1164

原创 目标检测的发展史及关键技术概述

目标检测是计算机视觉领域中的一个基础问题,它旨在识别出图像中所有感兴趣的目标,并给出它们的位置和类别。从早期的模板匹配到现代的深度学习方法,目标检测技术经历了多个发展阶段。本文将透过时间的迷雾,回顾目标检测技术的发展历程,并介绍其关键技术点与代表性成果。

2024-02-01 10:44:24 1679

原创 图像分类的发展史

创建者:ImageNet由李飞飞教授的团队在斯坦福大学创建。规模:ImageNet包含超过 1,000 万的带有标签的高分辨率图像,覆盖 2 万多个类别。结构:数据集的结构是基于 WordNet 的层次结构(每个同义词集表示一个概念),并且以此组织图像。用途:广泛用于训练深度学习模型,尤其是卷积神经网络(CNN),在计算机视觉领域具有ImageNet 在图像分类领域的发展起到了革命性的推动作用。

2024-01-31 20:05:12 1361

原创 深度学习之图像分类

深度学习对于图像分类来说已经斩获了显著的成果,无论是识别日常生活中的物体还是识别疾病肺部CT扫描中的异常病变,深度学习在图像分类中的应用都已经相当广泛。

2024-01-31 15:51:03 1510

原创 [每日一图] 浮点数

在进行浮点数运算时,尤其是迭代性运算,可能会引入舍入误差。浮点数运算涉及加法、减法、乘法和除法等操作,但由于浮点数表示的有限性,可能导致精度损失和舍入误差。在进行浮点数运算时,应当注意避免累积误差的积累。这个标准定义了两种浮点数表示格式:单精度(32位)和双精度(64位)。由于精度限制,直接比较两个浮点数是否相等可能不是明智的选择。用于表示数的阶码,以补码形式存储,用于指定数的数量级。用于表示未定义或无效的操作的结果,例如0/0。用于表示正数或负数,0表示正数,1表示负数。表示超过浮点数表示范围的数值。

2024-01-31 15:24:52 353

原创 [每日一图] 定点数的机器码:原码/反码/补码/移码

计算机内存中存储的是机器码,计算机之间的数据传输也是以机器码为基础进行的。计算机处理器能够识别和执行机器码,执行特定操作和算法。通过分析和理解程序的机器码,可以对程序进行优化,提高执行效率和性能。指令和算法执行:机器码是计算机指令和算法的表示形式。通过机器码,计算机能够执行复杂的指令和算法,实现各种功能和任务。总之,机器码是计算机系统中必不可少的一部分,它是计算机能够识别、执行和控制的基础,对于计算机的正常运行和程序的正确执行具有重要的作用。机器码是计算机能够识别和执行的最基本的指令和数据表示形式。

2024-01-30 22:33:55 407

原创 基于GAN-CNN-CNN的鲁棒笔迹识别方法(三)

提出了一个用于笔迹识别(鉴别)的三段式模型,同时也提出了一个新数据集HTID_1,本文主要针对模型的最后一部分--笔迹识别,在HTID_1上进行实验.

2024-01-29 16:58:25 2033 3

原创 [每日一图] 加法器

在二进制系统中,加法器对应于十进制中的加法操作,但是它执行的是二进制数的相加。基本的加法器有半加法器和全加法器。两个二进制数位相加可能会产生进位,因此加法器不仅需要计算各个位的和,还需要考虑进位。在计算机和数字电子系统中,加法器是一个基本的组件,用于将两个或多个数字相加。全加法器可以处理三个输入:两个用于相加的数字位和一个表示前一位的进位。:多个全加法器可以组合成更大的加法器,用于执行更复杂的二进制加法。半加法器用于将两个单独的二进制位相加,并产生两个结果:一个是该位的和,另一个是进位(carry)。

2024-01-29 10:42:28 397

原创 如何构造异或门

首先处理输入相同的情况,怎么让1_1变成0,方法有很多,与非门或者把一个输入反转再通过与门.总之有个重点就是得把其中一个输入反转.这个门同时也得让0_0输出0,显然与非门不行,把一个输入反转再通过与门可行.在数字电路中异或作为一种基础运算,一般以上面的方式出现,那异或是怎么来的,或者说能不能用更基础的运算(如与、或、非)去构造它?一个不够就用两个,这样就有两个输出,总有一个是对的,再针对这两个输出用一个或门就解决了.第2种情况输出0了,发现输出与输入的位置有关,那么怎么解决这种问题?

2024-01-28 17:20:33 531

原创 WSL2+CUDA环境搭建

wsl 占用内存较多打开终端输入用户名密码原装配方阿里云更新软件列表常用命令正在运行的WSL关闭Linux关闭所有。

2024-01-27 15:43:32 363

原创 基于GAN-CNN-CNN的鲁棒笔迹识别方法(二)

上一篇讲到了HTID_0数据集的建立以及它的缺陷,本节主要内容是模型的架构和新数据集HTID_1的建立.

2024-01-27 15:17:10 990

原创 基于GAN-CNN-CNN的鲁棒笔迹识别方法(一)

目前的笔迹识别方法或多或少都要用到一些传统方法,如切割字符、特征提取等过程.这些方法比较常用的有投影法、滴水法、HOG特征、Gabor特征、SIFT特征等.投影法[2]在提取特征后,使用机器学习方法,如KNN、SVM等对笔迹进行分类识别,现有的文献显示出不错的结果,如DeepWriter对 300 个作者,输入一个汉字,识别准确率达到 93.85%[3].基于这种光明的前景😋,我也抱着玩一玩的心态去尝试一下这个项目.

2024-01-19 22:48:39 835

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除