自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 Riffusion Audios Generation API 对接说明

如果想自定义生成歌词,可以输入歌词:这时候lyriclyric:歌词文本custom:填写为true,代表自定义生成,该参数默认为 false,代表使用prompt生成。title:歌曲的标题。style:歌曲的风格,选填。填写样例如下:填写完毕之后自动生成了代码如下:测试允许,生成的效果是类似的。

2025-09-11 00:25:11 424

原创 Luma 视频生成 API 对接说明

如果想通过自定义视频的首尾帧来生成视频,可以输入首尾帧的图片链接:这时候视频首帧字段可以传入以下图片作为视频的首帧:action:视频生成任务的行为,通常是普通生成generate和扩展生成extend,默认为generate。start_image_url:指定生成视频的首帧。end_image_url:指定生成视频的尾帧。prompt:生成视频的关键词内容。

2025-09-10 16:20:31 764

原创 Recaptcha2 图像识别 API 对接说明

本文将介绍一种 Recaptcha2 图像识别2 API 对接说明,它可以通过用户输入识别的内容和 Recaptcha2验证码图像,最后返回需要点击的小图像的坐标,完成验证。接下来介绍下 Recaptcha2 图像识别 API 的对接说明。

2025-09-10 00:26:55 1063

原创 AI证件照制作 API 快速生成证件照

本文将介绍一种 AI证件照制作 API 对接说明,它是可以通过输入人像照片URL以及自己喜欢的模板来制作各种风格的证件照。接下来介绍下 AI证件照制作 API 的对接说明。

2025-09-09 08:21:29 700

原创 Google SERP API 对接说明

如果您自定义搜索资源的类型,我们可以修改参数type,它分别包含了普通资源search、图片资源images、新闻资源news、地图资源maps、地区资源places、视频资源videos,本文将以视频资源videos做一个示范。下面我们来演示下具体的操作。首先,将type参数设置为videos,并正常传递query参数,如图所示:news,搜索结果中视频信息列表。可以看到,这里返回的结果中有一个videos字段,它主要包含了搜索关键词的结果。该接口也支持限定搜索结果的所在国家,我们可以添加。

2025-09-08 16:35:40 794

原创 AI证件照制作 API 对接说明

本文将介绍一种 AI证件照制作 API 对接说明,它是可以通过输入人像照片URL以及自己喜欢的模板来制作各种风格的证件照。接下来介绍下 AI证件照制作 API 的对接说明。

2025-09-08 08:39:49 628

原创 移动 4G 蜂窝代理对接说明

在爬虫与反爬虫斗争愈演愈烈的情况下,各大网站和 App 的风控检测越来越强,其中一项就是 IP 封禁。为了解决 IP 封禁的困扰,一个有效的方式就是设置代理,设置代理之后,爬虫可以借助代理的 IP 来伪装自己的真实 IP 地址,从而突破反爬虫的限制。但代理的质量有高有低,比如市面上的免费代理,几乎绝大多数都是不可用或者被封禁的状态,而有些付费普通代理也陆续被加入了各大网站和 App 的风控黑名单。

2025-09-08 00:37:46 704

原创 AI证件照制作 API 快速生成证件照

本文将介绍一种 AI证件照制作 API 对接说明,它是可以通过输入人像照片URL以及自己喜欢的模板来制作各种风格的证件照。接下来介绍下 AI证件照制作 API 的对接说明。

2025-09-07 17:02:27 595

原创 Midjourney API 申请及使用

Midjourney 是一款非常强大的 AI 绘图工具,只要输入关键字,就能在短短一两分钟生成十分精美的图像。Midjourney 以其出色的绘图能力在业界独树一帜,如今,Midjourney 早已在各个行业和领域广泛应用,其影响力愈发显著。本文档主要介绍 Midjourney API 中 Imagine 操作的使用流程,利用它我们可以轻松通过文本生成所需要的图像。

2025-09-07 08:50:54 1173

原创 Recaptcha2 图像识别 API 对接说明

本文将介绍一种 Recaptcha2 图像识别2 API 对接说明,它可以通过用户输入识别的内容和 Recaptcha2验证码图像,最后返回需要点击的小图像的坐标,完成验证。接下来介绍下 Recaptcha2 图像识别 API 的对接说明。

2025-09-07 00:36:40 787

原创 大模型Rag-指令调度

大模型Rag,本文主要记录根据用户问题指令,匹配最相关描述集,可用于匹配后端接口以及展示答案及图表等。

2025-04-17 14:37:45 949

原创 WSL报错libcudnn_cnn_infer.so.8

运行时仍然报这个错误 Could not load library libcudnn_cnn_infer.so.8. Error: libcuda.so: cannot open shared object file: No such file or directory Please make sure libcudnn_cnn_infer.so.8 is in your library path!WSL中安装好了CUDA和cudnn,nvidia-smi也没有问题。

2025-01-14 10:15:13 444

原创 MMDetection3DV1.4.0从环境配置到代码解析

不得不说,官方文档应该有好长时间没有更新了,以至于对于较新版本的Pytorch和CUDA不支持,我最开始安装的Pytorch2.1,CUDA12.1,到了后面总有编译不过的地方,MMCV出错误。根据文档介绍,只支持Linux和Mac,windows只是实验性支持,为了保险起见,我这里选择了Linux平台,安装了WSL,方便windows和WSL进行切换。进入网址通过git下载,切换分支,并在终端进入项目文件夹,这一部分我是根据官方做的,没出现错误。这里我安装官方文档去做的,报了错误。

2025-01-07 18:50:50 1750 1

原创 Text-to-SQL方法研究

计算预测sql和示例sql之间的距离相似度。与基于上下文学习的方法不同,基于微调的方法通过在Text-to-SQL数据集上微调预训练语言模型的参数,让模型习得从自然语言问题生成SQL的能力。基于上下文学习的Text-to-SQL方法利用大语言模型强大的少样本学习能力,通过设计提示prompt使模型直接生成SQL,而无需微调模型参数。,论文中先对问题中的领域特定词进行掩码,然后基于嵌入式欧氏距离对候选示例进行排序,同时还考虑了候选SQL的相似度,最终选择兼顾问题和SQL相似度的高质量示例。

2024-09-27 14:30:16 2634

原创 LLama.cpp轻量化模型部署及量化

编译会用到CMake。起初对CMake不是很了解,对CMake和Make傻傻分不清。查资料了解到:CMake是一个跨平台的系统生成工具,它的主要作用是通过配置文件(通常是)生成适合于目标平台的构建脚本或文件。Make是一个构建自动化工具。通过读取Makefile 来执行编译和构建过程。# cmake -B:新建一个文件夹build_cuda,然后把所有需要被编译的文件都放到build_cuda文件下面# -DLLAMA_CUDA=ON:打开cuda开关,表示支持cuda。

2024-08-01 19:47:34 2654

原创 模型训练和推理过程中GPU显存都被哪些部分占用了

模型训练和推理过程中GPU显存都被哪些部分占用了

2024-08-01 11:33:59 1103

原创 从huggingface更快的下载模型

从huggingface上下载模型,大家都知道会很慢很慢,而且如果网络很差的话,会经常掉线。如下我想要下载shenzhi-wang/Llama3-8B-Chinese-Chat。最近发现了一个速度快的方法,---方法huggingface国内镜像站,方法如下。--resume-download:代表下载失败,下次下载从上次失败处继续。--local-dir:代表你要缓存的地方。配置huggingface国内镜像站。

2024-07-30 14:28:19 2370

原创 Text-to-SQL将自然语言转换为数据库查询语句

text2sql,把文本转化为SQL语言

2024-07-25 15:13:13 6351 28

原创 Midjourney文生图API 国内申请及对接方式

智慧生图,文生图,扩散模型

2024-05-13 14:54:30 1561

原创 10分钟揭秘Sora原理

由于Sora属于扩散模型,给它噪声Patch以及对应的文本提示作为输入,被训练来生成清晰的Patch,Open AI也训练出了对应的解码器,负责把生成的低维度潜在时空表示转化为高维度可视化的视频像素。经过后续更大规模的训练后,Sora有可能出现精准模拟现实世界的智能涌现,就像一个没来过地球的外星人在持续不断观看人类生产的无数部电影后,对地球上各种现象的推测也可能逐渐准确,这会是一条通往世界通用模型的路,既学习世界如何运作,并能真实模拟现实世界未来世界的AI系统。扩散模型的灵感来源是非平衡热力学。

2024-02-23 22:26:53 1222

原创 Collecting package metadata (current_repodata.json): failed问题解决方案汇总

在conda 环境下执行conda create -n xxx python=3.8 命令新建虚拟环境时,出现了Collecting package metadata (current_repodata.json): failed这个错误,新装的Anaconda每次创建虚拟环境都会出现这个问题,这里记录一下几种解决方案,后续在遇到可以直接参考啦。(我第一次遇到这个问题的时候有用,第二次在通过这个方法就没有用了)不知道是什么原理,知道的小伙伴可以在评论区解答一下。5、有博主说是源的问题,换成国内源就可以了。

2024-01-12 15:58:20 7894

原创 cuda、torch、torchvision对应版本以及安装

新建了一个虚拟环境,重装了torch和torchvision,期间torch安装了GPU版本的1.10.0,torchvision确安装成了cpu版本的1.10.0,反复尝试很多次才发现这个问题。记录一下,以备后续在用到。

2024-01-08 11:59:38 3286

原创 conda虚拟环境修改默认源

清华源实例:pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple。命令行永久使用默认源:pip config set global.index-url xxx。

2023-12-20 13:22:55 3352

原创 DETR模型结构

在模型框架图中,可以看到包含三个部分,第一部分包含CNN和位置编码的的backbone,第二部分包含transformer encoder 和decoder模块,第三部分是检测头,其中包含两个检测头,一个用于检测bounding box的类别,另一个用于预测bounding box的坐标。第二张图是transformer encoder和decoder的细节图。

2023-08-02 12:01:55 2353

原创 DETR目标检测算法概述

在训练阶段,首先将一张图像喂如DETR模型,会得到100个预测框,其中包含这100个预测框的类别信息和坐标信息(大部分图像中的object数量都不会超过100个)。通过标注信息知道,图像中包含两个object,然后使用匈牙利算法从预测出的100个候选框中删选出两个预测框,两个预测框和两个标注框是一一对应的关系。最后在使用筛选出的两个候选框和两个标注框,一起去计算损失,反向传播优化模型参数。

2023-08-02 11:15:16 1134

原创 基于图神经网络的电商购买预测

其中TopKPooling类似于下采样,是剪枝的过程,选择得分比较低的节点剪枝掉,然后再重新组合成一个新的图。

2023-06-19 17:34:20 4167 5

原创 MMLab-MMClassification学习记录

最近在看MMLab,其中用于图像分类的Classification模块是最先学习到的,在这里做一个小小的笔记,也算是记录一下自己的学习历程,后续在看的时候也有一个参考~~~mmclassification是openmmlab的一个算法库,专用于图像分类,里面的分类模型各种各样包含人工智能领域的格式卷积神经网络以及注意力网络等。

2023-05-24 18:18:35 447 1

原创 Selenium爬取前程无忧51job招聘信息

【代码】Selenium爬取前程无忧51job招聘信息。

2023-04-18 14:03:53 1317 1

原创 YOLOv5之yolo.py代码讲解

目标检测系列之YOLOv5-yolo.py代码讲解,yolo.py文件主要工作是搭建了YOLOv5网络模型,生成Model,yolo.pt文件也可以单独运行。YOLOv5中yolo.py代码的讲解,本文使用的YOLOV5-v6版本,小伙伴们可以自行去github上下载。

2023-04-08 23:20:28 4538 1

原创 YOLOV5中yolov5s.yarm文件解析

在YOLOv5的五个模型中(yolov5l.yarm, yolov5m.yarm, yolov5n.yarm, yolov5x.yarm)只有depth_multiple和width_multiple两个参数不一样,其他都是相同的。记录自己的学习经历。

2023-04-08 17:37:13 464

原创 Python实现排序算法—选择排序算法

Python实现排序算法—选择排序算法

2022-06-17 14:16:52 247 1

原创 Python实现排序算法—冒泡排序

这次先介绍实现冒泡排序。在列表中实现升序排列,检查列表每两个相邻的数,如果前面比后面大,则交换这两个数 一趟排序完成后,则无序区减少一个数,有序区增加一个数 指针从0开始 整个冒泡排序算法走了n-1趟 代码关键点:趟、无序区范围​​,冒泡排序时间复杂度为...

2022-06-17 10:59:21 592

原创 Python中的两个查找算法—线性查找和二分查找

查找:在一些数据元素中,通过一定的方法找出与给定关键字相同的数据元素的过程列表查找(线性表查找):从列表中查找指定元素 输入:列表、待查找元素 输出:元素下表(未找到元素时一般返回None或-1)内置列表查找函数:index()顺序查找(Linea Search)顺序查找:也叫作线性查找,从列表第一个元素开始,顺序进行搜索,直到找到元素或搜索到列表最后一个元素为止1.顺序查找(Linea Search)时间复杂度为O(n)顺序查找是把列表从头到尾查找一遍,最多找

2022-06-17 10:08:06 729

原创 汉诺塔(Hanoi)图解递归算法-Python实现

汉诺塔(Hanoi)图解递归算法-Python实现

2022-06-16 21:14:00 475

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除