- 博客(983)
- 资源 (23)
- 收藏
- 关注
转载 LangChain+LLM本地知识库问答:从企业单文档问答到批量文档问答
向AI转型的程序员都关注了这个号????????????过去半年,随着ChatGPT的火爆,直接带火了整个LLM这个方向,然LLM毕竟更多是基于过去的经验数据预训练而来,没法获取最新的知识,以及各企业私有的知识为了获取最新的知识,ChatGPT plus版集成了bing搜索的功能,有的模型则会调用一个定位于 “链接各种AI模型、工具”的langchain的bing功能为了处理企业私有的知识,要么基于开源模型微调,要...
2023-11-28 11:01:14
15
转载 ChatOCR:文心一言/千帆API实现关键信息提取
向AI转型的程序员都关注了这个号????????????文心一言+OCR是一种新颖的程序开发方法,它结合了深度学习与OCR技术,能够自动化提取图像中的文本信息。这一技术的崛起已经改变了信息提取的方式,因为它能够帮助人们更多地关注信息理解和分析,从而自动完成许多繁琐的任务,如文本扫描和识别。在传统的文本信息处理过程中,人们通常需要投入大量的时间和精力来进行文本扫描、识别和整理等工作。在这个过程中,借助文心一言+OCR...
2023-11-23 11:02:01
519
转载 大模型时代下智能文档处理核心技术大揭秘
向AI转型的程序员都关注了这个号????????????随着人工智能技术的发展,智能图像处理成为了一种风靡全球的热门技术。智能图像处理可以帮助我们从大量的图像数据中提取最有价值的信息,为医疗、军事、安防等领域带来了重大的贡献。然而,图像处理的难点也随之而来,下面我们来简单介绍一下图像处理的难点以及解决方式的比对。 首先,图像处理的难点在于如何从大量的图像数据中获取有价值的信息。图像数据通常包含大量的冗余信息,如何选...
2023-11-21 11:00:11
23
转载 最新ChatGPT/GPT4科研实践应用与AI绘图技术及论文高效写作
ChatGPT强大功能展示!↑↑↑点击查看视频 最新ChatGPT/GPT4科研实践应用与AI绘图技术及论文高效写作培训班现场时间:2023年11月30日-12月3日【30日全天报到,全程三天教学】直播时间:2023年12月1日-3日 【腾讯会议】江苏*南京【报名后见详细会议流程须知】01获取ChatGPT账号一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送Chat...
2023-11-18 11:33:45
38
转载 大模型(LLMs)算法工程师相关的面试题和参考答案
向AI转型的程序员都关注了这个号????????????目录大模型(LLMs)基础面1. 目前 主流的开源模型体系 有哪些?2. prefix LM 和 causal LM 区别是什么?3. 涌现能力是啥原因?4. 大模型LLM的架构介绍?大模型(LLMs)进阶面1. llama 输入句子长度理论上可以无限长吗?1. 什么是 LLMs 复读机问题?2. 为什么会出现 LLMs 复读机问题?3. ...
2023-11-13 11:01:30
72
转载 看完也许能进一步了解Batch Normalization
向AI转型的程序员都关注了这个号????????????标题:Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift论文链接:https://arxiv.org/pdf/1502.03167.pdf训练深度神经网络非常复杂,因为在训练过程中,随着先前各层的参数发生变化,各层输入的分布也会...
2023-11-02 11:01:06
55
转载 2023文本定位模型选型调研
向AI转型的程序员都关注了这个号????????????场景:做一个通用型的多种证件解析服务需求:调研一种又新又快的定位模型。要求:1)支持倾斜的文字,可以是4点定位或分割法后获取box,但不能是2点的定位;2)快速,过往的psenet需要至少0.6s,pan和db在一些场景中效果差一点但快,是否有更好平衡速度和效果的方法;3)方便改输出通道数量,这种一般是分割?;4)边缘准确;5)适用于中文大字典方法:从3个方法...
2023-11-01 11:02:33
186
转载 YOLOv7改进轻量化,引入轻量化骨干网络MobileOne
向AI转型的程序员都关注了这个号????????????一、前言MobileOne论文:https://arxiv.org/abs/2206.04040MobileOne github:https://github.com/apple/ml-mobileone二、基本原理使用Reparameterize重参数化实现模型的轻量化,基本模块如下图所示。三、改进方法说明:该部分的改进代码尽可能地根据官方代码的写法与YOL...
2023-10-30 11:00:21
121
转载 ChatIE(LLM大模型用于信息抽取)
向AI转型的程序员都关注了这个号????????????Zero-Shot Information Extraction via Chatting with ChatGPTpaper:https://arxiv.org/abs/2302.10205利用ChatGPT实现零样本信息抽取(Information Extraction,IE),看到零样本就能大概明白这篇文章将以ChatGPT作为一个基座然后补全前后端,来...
2023-10-27 11:01:29
65
转载 ChatGPT Plus账号全攻略,轻松上手绘图、论文写作、编程、PPT编辑、文献查阅等...
ChatGPT强大功能部分展示:最新ChatGPT-GPT4科研技术应用与AI绘图及论文高效写作培训班2023年11月16日-19日 【16日全天报到,全程三天教学】现场/直播培训同步进行【可自由选择参会模式】四川*成都【报名后见详细会议流程须知】账号获取一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送ChatGPT Plus会员账号,ChatGPT Plus会员账号...
2023-10-25 11:00:46
39
转载 ChatGPT Plus账号全攻略,轻松上手绘图、论文写作、编程、PPT编辑、文献查阅等...
ChatGPT强大功能部分展示:最新ChatGPT-GPT4科研技术应用与AI绘图及论文高效写作培训班2023年11月16日-19日 【16日全天报到,全程三天教学】现场/直播培训同步进行【可自由选择参会模式】四川*成都【报名后见详细会议流程须知】账号获取一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送ChatGPT Plus会员账号,ChatGPT Plus会员账号...
2023-10-25 11:00:46
27
转载 ChatGPT Plus账号全攻略,轻松上手绘图、论文写作、编程、PPT编辑、文献查阅等...
ChatGPT强大功能部分展示:最新ChatGPT-GPT4科研技术应用与AI绘图及论文高效写作培训班2023年11月16日-19日 【16日全天报到,全程三天教学】现场/直播培训同步进行【可自由选择参会模式】四川*成都【报名后见详细会议流程须知】账号获取一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送ChatGPT Plus会员账号,ChatGPT Plus会员账号...
2023-10-25 11:00:46
20
转载 ChatGPT Plus账号全攻略,轻松上手绘图、论文写作、编程、PPT编辑、文献查阅等...
ChatGPT强大功能部分展示:最新ChatGPT-GPT4科研技术应用与AI绘图及论文高效写作培训班2023年11月16日-19日 【16日全天报到,全程三天教学】现场/直播培训同步进行【可自由选择参会模式】四川*成都【报名后见详细会议流程须知】账号获取一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送ChatGPT Plus会员账号,ChatGPT Plus会员账号...
2023-10-25 11:00:46
26
转载 ChatGPT Plus账号全攻略,轻松上手绘图、论文写作、编程、PPT编辑、文献查阅等...
ChatGPT强大功能部分展示:最新ChatGPT-GPT4科研技术应用与AI绘图及论文高效写作培训班2023年11月16日-19日 【16日全天报到,全程三天教学】现场/直播培训同步进行【可自由选择参会模式】四川*成都【报名后见详细会议流程须知】账号获取一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送ChatGPT Plus会员账号,ChatGPT Plus会员账号...
2023-10-25 11:00:46
16
转载 ChatGPT Plus账号全攻略,轻松上手绘图、论文写作、编程、PPT编辑、文献查阅等...
ChatGPT强大功能部分展示:最新ChatGPT-GPT4科研技术应用与AI绘图及论文高效写作培训班2023年11月16日-19日 【16日全天报到,全程三天教学】现场/直播培训同步进行【可自由选择参会模式】四川*成都【报名后见详细会议流程须知】账号获取一:每人均可获得1个独立可永久免费使用的ChatGPT账号二:【超级福利】赠送ChatGPT Plus会员账号,ChatGPT Plus会员账号...
2023-10-25 11:00:46
20
转载 华为2023年多元时间序列预测模型(MTS-Mixers)
向AI转型的程序员都关注了这个号????????????华为在这2023年2月9日发布了一篇关于多元时间序列预测的文章,借鉴了NLP中前一阵比较热的Mixer模型,取代了Attention结构,不仅实现了效果上的提升,而且还实现了效率上的提高。1. Transformer的探讨Transformer在时间序列预测中的作用最近得到非常广泛地探讨。下图为经典Transformer时间序列预测模型图。Transforme...
2023-10-19 11:01:05
190
转载 yolov5的PCB缺陷检测,引入CVPR 2023 BiFormer
向AI转型的程序员都关注了这个号????????????一、数据集介绍印刷电路板(PCB)瑕疵数据集:数据下载链接,是一个公共的合成PCB数据集,由北京大学发布,其中包含1386张图像以及6种缺陷(缺失孔,鼠标咬伤,开路,短路,杂散,伪铜),用于检测,分类和配准任务。选取其中445张图像进行了训练。数据样本示例:1.PCB数据集介绍PCB是最具竞争力的产业之一,其产品的优良则关系到企业的发展。由于产品外观缺陷的种类...
2023-10-11 11:01:10
164
转载 一文详解深度学习与NLP十年发展史(赠200+篇论文&数据集)
深度学习作为人工智能科研领域的一个重要分支,在多个场景中展现出惊人的能力,无论是自动驾驶汽车,还是人脸识别系统,甚至是与人对话的机器人,背后都离不开它的技术支持。近年来,Transformer架构及其变体,如BERT、GPT和T5等,已经成为NLP领域的主流。特别是预训练模型,如BERT,通过在大量的无标签文本上进行预训练,再在特定任务上进行微调,使得模型能够充分利用海量的文本数据,从而在多种NL...
2023-10-10 11:00:48
49
转载 为什么我建议你趁早考软考?
????#IT人 #积分落户、升职加薪、领奖金!到底是什么神仙证书吸引众多程序员争相报考?最近发现,软考报考人数已超500万!2020年40万,2021年94万,2022年129万,两年时间直翻3倍!如此火爆原因是什么?据统计:2023上半年不仅报名人数大涨,参考率也同步上升,竞争逐步激烈!软考也叫软件水平考试,IT圈公认的高含金量证书,加上政策福利贼好、市场需求变大,才日渐火热…????软考可考专业多:高...
2023-10-09 11:53:54
55
转载 几种典型的图像去噪算法总结
向AI转型的程序员都关注了这个号????????????(一)高斯低通滤波去噪 高斯低通滤波器(Gaussian Low Pass Filter)是一类传递函数为高斯函数的线性平滑滤波器。又由于高斯函数是正态分布的密度函数。因此高斯低通滤波器对于去除服从正态分布(Normal distribution)的噪声非常有效。一维高斯函数和二维高斯函数 (高斯低通滤波器的传递函数) 的表达形式分别如下:图1:...
2023-10-08 11:00:10
235
转载 python抠图(去水印)开源库lama-cleaner
向AI转型的程序员都关注了这个号????????????1. 关于 Lama CleanerLama Cleaner 是由 SOTA AI 模型提供支持的免费开源图像修复工具。可以从图片中移除任何不需要的物体、缺陷和人,或者擦除并替换(powered by stable diffusion)图片上的任何东西。特征:完全免费开源,完全自托管,支持CPU & GPU & M1/2Windows 一键安装...
2023-09-26 11:01:04
148
转载 AI应用网站200个汇总,图像文本视频音乐生
向AI转型的程序员都关注了这个号????????????AI 应用文心一言: https://yiyan.baidu.com/百度出品的人工智能语言模型ChatGPT: https://chat.openai.com一款功能丰富、智能化、易用性强的人工智能工具,适用于各种内容创作者TreeMind树图: https://shutu.cn/?from=haiyong新一代“AI智能”思维导图,在线思维导图制作工具软件...
2023-09-23 11:01:28
379
转载 大学学习什么课程才能成为稚晖君?
向AI转型的程序员都关注了这个号????????????首先,机器学习深度学习这些和硬件是两个领域的内容,个人不建议一起学,注意力不能聚焦的话效果会很差。。而且机器学习对数学要求很高,在数学水平不够的时候很难做出什么比较新奇的东西。最好先把硬件底子学好,软件部分知识可以同时学,硬件基础一定要打好。。。个人认为分为以下几个阶段吧。提示:本回答只针对稚晖君嵌入式基础部分的学习路线。第一阶段:数理基础这个阶段主要是打基础...
2023-09-21 11:01:10
57
转载 动手学深度学习-(李沐)PyTorch版本
向AI转型的程序员都关注了这个号????????????预备知识要学习深度学习,首先需要先掌握一些基本技能。所有机器学习方法都涉及从数据中提取信息。因此,我们先学习一些关于数据的实用技能,包括存储、操作和预处理数据。机器学习通常需要处理大型数据集。我们可以将某些数据集视为一个表,其中表的行对应样本,列对应属性。线性代数为人们提供了一些用来处理表格数据的方法。我们不会太深究细节,而是将重点放在矩阵运算的基本原理及其实...
2023-09-15 10:00:47
149
转载 yolov7车牌识别算法,支持12种中文车牌类型
向AI转型的程序员都关注了这个号????????????1.单行蓝牌2.单行黄牌3.新能源车牌4.白色警用车牌5 教练车牌6 武警车牌7 双层黄牌8 双层武警9 使馆车牌10 港澳牌车11 双层农用车牌12 民航车牌项目开源代码获取地址:关注微信公众号 datayx 然后回复车牌 即可获取。测试demo:以yolov7-lite-s 为例:python detect_rec_plate.py --detec...
2023-09-13 11:00:05
192
转载 文本检测DBNet++ | 为 DBNet 引入多级特征图聚合模块 ASF
向AI转型的程序员都关注了这个号????????????文章目录一、背景二、方法2.1 Adaptive Scale Fusion (ASF) 模块2.2 Binarization2.3 Adaptive Threshold2.4 Deformable Convolution2.5 Label Generation2.6 Optimization三、效果论文:Real-Time Scene Text Detecti...
2023-09-12 11:00:34
106
转载 Python 机器学习+深度学习项目实战
向AI转型的程序员都关注了这个号????????????一 Python运行软件(Pycharm,Anaconda 注意事项:我们一般用的python版本是python3.5,python3.6和python3.7安装 tensorflow时很麻烦,而且各种包也与高版本的python冲突。所以我们统一采 用python3.5。解释一下:官网安装的是高版本的,但需要在Anaconda下添加...
2023-09-06 11:00:34
245
转载 nnUNet图像分割教程!从环境配置到训练与推理
向AI转型的程序员都关注了这个号????????????nnUNet是什么?nnU-Net是由德国癌症研究中心、海德堡大学以及海德堡大学医院研究人员(Fabian Isensee, Jens Petersen, Andre Klein)提出来的一个自适应任何新数据集的医学影像分割框架,该框架能根据给定数据集的属性自动调整所有超参数,整个过程无需人工干预。仅仅依赖于朴素的U-Net结构(就是原始U-Net)和鲁棒的训...
2023-08-31 11:00:32
176
转载 Transformer在计算机视觉中的应用-VIT、TNT模型
向AI转型的程序员都关注了这个号????????????Transforme这一模型并不难,依旧是传统机器翻译模型中常见的seq2seq网络,里面加入了注意力机制,QKV矩阵的运算使得计算并行。当然,最大的重点不是矩阵运算,而是注意力机制的出现。一、CNN最大的问题是什么CNN依旧是十分优秀的特征提取器,然而注意力机制的出现使得CNN隐含的一些问题显露了出来CNN中一个很重要的概念是感受野,一开始神经网络渐层的的卷...
2023-08-30 11:00:31
103
转载 LLMs 入门实战系列
向AI转型的程序员都关注了这个号????????????【LLMs 入门实战系列】第五重 GPT4ALL第十一重 OpenBuddy第十二重 Baize第十三重 OpenChineseLLaMA第十四重 Panda第十五重 Ziya-LLaMA-13B第十六重 BiLLa第十七重 Luotuo-Chinese-LLM第十八重 Linly第十九重 ChatYuan第二十重 CPM-Bee第二十一重 TigerBot第...
2023-08-26 10:01:44
225
转载 生成式AI模型优化赛 第三名方案
向AI转型的程序员都关注了这个号????????????TensorRT 作为 NVIDIA 英伟达 GPU 上的 AI 推理加速库,在业界得到了广泛应用与部署。与此同时,TensorRT 开发团队也在持续提高产品的好用性:一方面让更多模型能顺利通过 ONNX 自动解析得到加速,另一方面对常见模型结构(如 MHA)的计算进行深度优化。这使得大部分模型不用经过手工优化,就能在 TensorRT 上跑起来,而且性能优秀...
2023-08-18 11:00:51
96
转载 Llama中文社区,最好的中文Llama大模型,完全开源可商用
向AI转型的程序员都关注了这个号????????????Meta 终于发布了免费可商用版本 ,让开源大模型领域的格局发生了巨大变化。Llama 2 模型系列包含 70 亿、130 亿和 700 亿三种参数变体,相比上一代的训练数据增加了 40%,在包括推理、编码、精通性和知识测试等许多外部基准测试中展示出了优越的表现,且支持多个语种。项目开源代码获取地址:关注微信公众号 datayx 然后回复Llama2 即...
2023-08-10 11:00:13
102
原创 算法工程师-机器学习面试题总结(5)
如果某个取值出现的概率很高,那么我们可以使用较短的编码表示它,因为它的出现是较为确定的,带来的信息量较少。相反,如果某个取值出现的概率很低,那么我们需要使用较长的编码表示它,因为它的出现是不太确定的,带来的信息量较多。假设有k个互斥的结果(event),且每个结果发生的概率分别为p1, p2, ..., pk,那么在进行n次独立的试验后,每个结果发生的次数分别为x1, x2, ..., xk,多项式分布可以描述x1, x2, ..., xk的概率情况。对于离散分布,似然函数是各个观测数据出现的概率的乘积;
2023-08-07 23:27:59
401
原创 算法工程师-机器学习面试题总结(4)
然而,较小的批量大小可能导致不稳定的梯度估计,增加训练过程中的震荡,并且由于计算和内存需求较大,可能会导致训练时间的增加。然而,较大的批量大小可能会导致更大的内存开销,限制了模型的扩展性,并且可能陷入局部最优解,因为每次更新都是基于一批样本的平均梯度。通过Batch Normalization,可以使得输入数据的分布更加稳定,缓解梯度消失和爆炸的问题,加速网络的收敛速度,并且对网络的初始权重初始化要求较低。RNN在不同的时间步共享相同的权重参数,这使得它能够在处理相同的模式和特征时具有一定的灵活性。
2023-08-07 23:22:22
694
原创 算法工程师-机器学习面试题总结(3)
需要注意的是,由于RF是一种集成方法,特征重要度的计算相对准确,但在某些情况下也可能受到数据的噪声或决策树数量的影响。优点是对于数据点从不同的高斯分布生成的情况有较好的效果,可以灵活地表示不同形状和密度的簇,但对初始参数的选择敏感。一般来说,随着k的增加,SSE会逐渐减小,但当k接近真实的簇数量时,SSE的下降幅度会变得较为缓慢。轮廓系数综合考虑了样本的类内相似度和类间相异度,数值范围在 -1 到 1 之间,接近1表示样本与同簇中的其他样本相似度高,与其他簇中的样本相似度低,反之亦然。
2023-08-07 23:19:51
449
原创 离线环境conda虚拟环境备份迁移--conda pack问题
离线环境conda虚拟环境备份迁移--conda pack问题,Collecting packages...CondaPackError: Files managed by conda were found to have been deleted/overwritten in thefollowing packages:
2023-08-07 16:23:51
1902
原创 算法工程师-机器学习面试题总结(2)
线性回归是一种用于建立和预测变量之间线性关系的统计模型。其基本思想是假设自变量(输入)和因变量(输出)之间存在线性关系,通过建立一个线性方程来拟合观测数据,从而进行预测和推断。线性回归的基本步骤如下:1. 数据收集:收集包含自变量和因变量的观测数据。自变量是用于预测因变量的输入变量,而因变量是我们希望预测或解释的输出变量。2. 模型假设:假设自变量和因变量之间存在线性关系,即可以通过一个线性方程来描述二者之间的关系。
2023-07-25 23:28:31
578
原创 算法工程师-机器学习面试题总结(1)
一、机器学习相关1.基本概念1-1 损失函数是什么,如何定义合理的损失函数?损失函数是在机器学习和优化算法中使用的一种衡量模型预测结果与真实值之间差异的函数。其目标是最小化模型的预测误差,从而提高模型的性能。定义合理的损失函数需要考虑以下几个因素: 任务类型:不同的任务(如回归、分类、聚类等)需要选择不同类型的损失函数。比如,在回归问题中,常用的损失函数有均方误差(Mean Squared Error)和平均绝对误差(Mean Absolute Error);在分类问题中,交叉熵损失函
2023-07-24 23:02:31
502
转载 开源大语言模型LLMs汇总
向AI转型的程序员都关注了这个号????????????大语言模型大语言模型(LLM)是指使用大量文本数据训练的深度学习模型,可以生成自然语言文本或理解语言文本的含义。大语言模型可以处理多种自然语言任务,如文本分类、问答、对话等,是通向人工智能的一条重要途径。发展历史2020年9月,OpenAI授权微软使用GPT-3模型,微软成为全球首个享用GPT-3能力的公司。2022年,Open AI发布ChatGPT模型用于...
2023-07-20 11:00:25
424
转载 AI领域中一个被严重低估的方向!
大模型出来之后,模型不变,但数据量日新月异,重新训练模型的时间成本和能量花费都是不可接受的。连续学习以其快速适应能力,以及对过去数据不做高要求的优势,成为大模型时代面向变化数据的主要学习方式。可持续人工智能中的核心研究之一就是连续学习(continual learning, CL),亦称为增量学习或终身学习,赋予了 AI 系统适应环境的能力。不同于过去大量的重复训练,连续学习通过不断地更新模型参数...
2023-07-19 11:00:22
96
COCO API的安装包 cocoapi.zip 安装pycocotools
2021-09-10
Cube-IQ-使用方法_图文说明_使用步骤.docx
2021-05-05
TensorRT-7.0.0.11.CentOS-7.6.x86_64-gnu.cuda-10.0.cudnn7.6.txt
2021-04-10
Deep Learning for NLP with TensorFlow2.0.zip
2020-07-10
linux系统(Ubuntu)已编译darknet(cpu版)直接可用
2020-02-27
darknet_windows.rar已编译直接可用yolo3
2020-02-27
阿里巴巴机器智能技术精选合集.PDF
2019-12-05
语义相似度任务-LCQMC数据集下载lcqmc.zip
2019-07-28
GoogleNews-vectors-negative300.bin.gz
2019-07-20
细粒度用户评论情感分析数据集(2018-AI-challenger)
2019-03-23
Kaggle自然语言处理文本匹配竞赛华人第1名团队PPT与代码-深度学习与特征工程
2018-11-28
phantomjs安装包phantomjs-2.1.1-windows
2017-08-20
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人