人工智能与深度学习算法研究
文章平均质量分 80
从原理上讲解各种算法与实战案例。用算法解决问题,专攻机器视觉、深度学习的落地,采用Tf、keras、caffe等框架嵌入C++、Python、Android中、全程源码开放。细致教学。
优惠券已抵扣
余额抵扣
还需支付
¥19.90
¥99.00
购买须知?
本专栏为图文内容,最终完结不会低于15篇文章。
订阅专栏,享有专栏所有文章阅读权限。
本专栏为虚拟商品,基于网络商品和虚拟商品的性质和特征,专栏一经购买无正当理由不予退款,不支持升级,敬请谅解。
南七小僧
C9博士,前百度、联想技术产品总监。深入理解人工智能技术研发与应用。
展开
-
FastGPT + Xinference + OneAPI:一站式本地 LLM 私有化部署和应用开发
上述步骤已经利用 API 的返回拼装出了含有某个城市查询天气情况的所有信息,我们用 “AI对话” 模块来总结回复,记得将对话模型切换为 Qwen。原创 2024-01-14 02:28:20 · 2560 阅读 · 7 评论 -
数据增强:弹性变形(Elastic Distortion)水波纹
下图是论文中的不同δ值对随机位移场的影响,下图左上角为原图,右上角为δ较小的情况(可以发现,位移方向非常随机),左下角和右下角为较大的不同δ值。step6:弹性变形最终输出的imageC中每个位置的灰度值大小,组成一副变形图像,现在imageC中每个像素点存储的是(x+△x, y+△y),如下图中的A’,那怎么转化成灰度值呢,依据论文,作者是根据imageB中的B位置的双线性插值灰度值作为A’点的像素灰度值大小,最终将imageC输出得到变形图像。其位移范围在(-1, 1)之间,得到一个随机位移场(原创 2023-08-03 01:53:20 · 268 阅读 · 0 评论 -
在Carla中加入可以使用的自己的车
骨架下载成功后,将骨架.rar文件解压,会看到两个.fbx文件(VehicleSkeletonBinary.fbx,VehicleSkeletonfbx)。然后选中车轮,按L键,快速选中所有车辆,再按P,使之成为独立个体,对所有车轮如此操作。然后进入物理模型中,添加调整车辆运动模型,添加下列部分,部分可以在下图2中复制粘贴。然后进入物体模式,选中骨骼后,按A键,选中所有,再按CTRL+p选择附带空顶点组。完成之后可以进入姿态模式,选中骨骼,按R进行旋转,检测骨骼所连接的车轮是否正确。原创 2023-08-03 00:15:40 · 331 阅读 · 0 评论 -
carla仿真器搭建及特定车辆模型的导入
搜索vehicle后点击VehicleAnimInstance,然后在Target Skeleton中搜索v3(我们模型车名称),弹出了v3_Skeleton(这个是我们前面导入.fbx文件时产生了文件),点击v3_Skeleton,就完成了Animation文件的创建,我们将它命名为BP_v3_anim,双击该文件进入到该文件的编辑界面中,过程比较繁琐,具体编辑过程参考视频【1】,有详细操作,这里主要给出关键的操作步骤,编辑之后的最终效果如下图所示。具体过程这里不再叙述,请参看上面文章。原创 2023-08-03 00:00:00 · 804 阅读 · 0 评论 -
在windows11上安装最新版的gcc/g++(MinGW)--gcc version 12.2.0
既可在其中下载最新的MinGW,我的电脑是64位的windows11, 所以我下载的是x86_64-12.2.0-release-win32-seh-rt_v10-rev0.对于8.1.0,直接使用-stdc++17编译的话,会有一些问题,ps:好像是在9版本之后才修复的。点击download,下翻找到MinGW-builds的。一个很大的问题就是版本太久了,最新的到8.1.0。那么我想下载解压即用的新版MinGW该怎么办呢?原创 2023-07-20 00:16:32 · 3381 阅读 · 0 评论 -
Windows下CMake mingw make 编译环境搭建
电脑系统:Windows10家庭中文版。原创 2023-07-20 00:01:14 · 397 阅读 · 0 评论 -
一招解决CMake编译报错:【CUDA】No CUDA toolset found.
问题:cMake编译报错:No CUDA toolset found.将该路径下的四个文件 C:\Program Files\NVIDIA。解决:在stackoverflow找到解决方案。注意:换成自己的路径。原创 2023-07-19 23:58:26 · 3135 阅读 · 1 评论 -
Apollo无人驾驶平台中多传感器标定
是无人车最基础也是最核心的模块之一。作为软件层提供的第一项服务,标定质量和准确度极大地影响着等模块。在 Apollo 开源自动驾驶平台中,我们提供了丰富的多传感器标定服务,如等多种传感器之间的标定。算法覆盖常规 Level 2-Level 4 级别自动驾驶的传感器配置和标定需求。原创 2023-06-30 02:04:22 · 766 阅读 · 0 评论 -
几款开源的自动驾驶仿真平台项目
它被开发为一个虚幻的插件,可以简单地放到任何你想要的虚幻环境中。第一类是基于合成的数据,对环境、感知及车辆进行模拟,这里的感知大多数是图像层面的感知,这类模拟器主要用于感知、规划算法的初步开发上,Carla、AirSim、Udacity self-driving car simulator就属于这类;第二类是基于真实数据的回放,这里的真实数据包括图像、lidar、radar等各种传感器的数据,这类模拟器主要用于测试无人驾驶中信息融合算法以及车辆不同部件的性能,Apollo和Autoware就属于这类。原创 2023-06-30 01:54:25 · 1622 阅读 · 0 评论 -
智能网联无人驾驶农机现状
碧桂园立足无人农场的最终场景,建立智慧农业云平台,立足“耕种管收运”全农业流程的无人化作业,在无人化农机产品化落地、多机协同调度、智慧农业等领域真正实现了无人驾驶在农业领域的场景化开发,符合农场当前需求,满足农艺要求,为农业的大规模、标准化、无人化的作业模式的普及提供了技术支持,引领了智慧农业、农机自动驾驶前沿技术,在自动驾驶在农机复杂环境感知与避障、田间最优全局路径规划、高精度轨迹跟踪控制、多机调度等方面的技术达到了行业领先水平。与此同时,在国家政策的强力拉动下,农村土地迅速流转集中。原创 2023-06-30 01:54:16 · 252 阅读 · 0 评论 -
自动驾驶路径规划与行为预测最接地气详细综述
图1:路径规划在决策控制三大子领域中的主要应用首先需要说明的是:路径规划(本文不严格区分轨迹规划与路径规划的定义,一律按照路径规划称呼)并不止属于单车自动驾驶,在车队列协同控制、交通流车辆协同规划、人机共驾等等各个领域中路径规划普遍存在。单车自动驾驶中,规划算法可与预测类算法结合提高车辆安全性;车队列协同控制中,不论车队列控制形式为leader-following还是predecessor-following等等,总要有某个智能体进行规划,后续车辆跟随并保证队列稳定性;原创 2023-06-30 01:52:35 · 150 阅读 · 0 评论 -
开源数字人、虚拟直播部署教程
对,你无看错,是欧美的。在直播带货案例里,我们把模型导入到ue4,我们给模型在ue4里预设了四个动作(站着、站着说话、坐着、坐着说话),三个表情(平静、开发、愤怒),三个镜头(全局、近矩说话、看显示器播放商品展示)。我们只需要把目标主播的直播给录制下来,提取样本数据,然后训练一个从粉丝的不同刺激的组合,到主播的不同响应方式的多元逻辑回归的数学模型参数即可。原创 2023-06-13 01:54:56 · 3156 阅读 · 0 评论 -
人体三维重构论文集合:awesome 3d human reconstruction
人体三维重构论文 开源集合原创 2023-05-28 16:24:49 · 747 阅读 · 0 评论 -
命名实体识别(NER)标注神器——Label Studio 简单使用
3、BiLSTM + CRF NER 任务可以参考:https://blog.csdn.net/qq_44193969/article/details/116008734-文章写的有点潦草,代码可以跑通,后续有空会重新编辑一下,感兴趣的同学将就着看吧哈哈。10、至此,我们就选择好了所有的配置,看起来很麻烦事因为我说的比较细,就怕有些同学看不懂。文件格式也可以是CSV,按理说只要是一行一条数据的都可以,感兴趣的同学可以自己探索下。注意:标注完成后,一定要点击Submit提交已标注的数据,要不然,一天白干。..原创 2022-08-16 15:38:05 · 1730 阅读 · 1 评论 -
如何设计一个【带距离属性】的膨胀核 Python
领悟一下这里,kernel用的是1.如果自己设计一个 已中心为1,四周发散的膨胀核再去卷积呢?最简单的做法就是 设计一个高斯膨胀核。那么怎么设计高斯膨胀核呢?# 高斯核生成函数def creat_gauss_kernel(kernel_size=3, sigma=1, k=1): if sigma == 0: sigma = ((kernel_size - 1) * 0.5 - 1) * 0.3 + 0.8 X = np.linspace(-k, k,..原创 2020-11-24 18:09:22 · 382 阅读 · 5 评论 -
OpenCV DNN模块——从TensorFlow模型导出到OpenCV部署详解
本文来自OpenCV中文网粉丝小庄头发很多投稿。(原文链接:https://blog.csdn.net/weixin_39928773/article/details/103910850)引言对于机器视觉从事者或者研究者来说,把训练好模型部署到项目中是关键的一步。现如今各大相机厂商都会提供相机的二次开发包,供给使用者进行使用和开发。据博主所知,目前大部分的相机开发包并不支持Python语言,而主流的深度学习框架都是基于Python语言,训练好的模型难以部署到自己的软件中。举个例子..原创 2020-06-05 17:22:27 · 891 阅读 · 1 评论 -
Basler C# 开发
/* This sample illustrates how to create a video file in MP4 format.*/using System;using Basler.Pylon;namespace Grab{ class Grab { const int countOfImagesToGrab = 100; ...原创 2019-11-25 10:42:09 · 828 阅读 · 0 评论 -
Anime head detection
源码地址:https://github.com/jiuxianghedonglu/AnimeHeadDetection1. DatasetAll the images in the dataset are collected fromkonachan.netand labeled by myself withLabelImg.Download datase...原创 2019-11-15 17:25:23 · 650 阅读 · 0 评论 -
Xception 进阶之路
论文:Xception: Deep Learning with Depthwise Separable Convolutions 论文链接:https://arxiv.org/abs/1610.02357算法详解: Xception是google继Inception后提出的对Inception v3的另一种改进,主要是采用depthwise separable convolution来替换原...原创 2018-08-23 14:14:43 · 384 阅读 · 0 评论 -
协同过滤 无依赖 自己实现 python 推荐算法
提到ALS相信大家应该都不会觉得陌生(不陌生你点进来干嘛[捂脸]),它是协同过滤的一种,并被集成到Spark的Mllib库中。本文就ALS的基本原理进行讲解,并手把手、肩并肩地带您实现这一算法。 1. 原理篇 我们用人话而不是大段的数学公式来讲讲ALS是怎么一回事。 1.1 你听说过推荐算法么 假如我是豆瓣的CEO,很多豆瓣的用户在豆瓣电影上都会对电影进行评分。那么...原创 2019-01-03 10:18:50 · 288 阅读 · 0 评论 -
词库+BILSTM+CRF做命名实体识别,对简历做用户缩略图
步骤: 1.用户上传简历,做pdf解析 2.通过CRF做简历格式的规整,【例如:将实体1与实体2中的内容 归结于实体1,从而格式化简历,提取出 姓名 识别 实习经历 校园经历 教育背景等等格式化的信息】,为什么只用CRF呢,因为这里需要快,用BILSTM+CRF对于大段文字,速度较慢 3.通过BILSTM+CRF针对实习经历……等等字段,提取NER 4.把提取出来的信息绘制在模板...原创 2019-01-09 11:14:18 · 1491 阅读 · 2 评论 -
Android APP 集成 Unet进行图像语义分割【tensorflow】
环境:WIN7 64 + Android Studio3.3Python 3.6Keras 2.3TF 1.9概述:1.先用Keras训练网络,保存为h5文件【model.save('xxx.h5')】2.用Keras2pb.py 把h5文件转成Tf的pb文件3.在Android src/main下新建Assets文件夹,把pb放到里面4.Android ...原创 2019-01-20 18:28:11 · 1904 阅读 · 4 评论 -
中英文翻译Seq2Seq
# -*- coding: utf-8 -*-"""Created on Mon Feb 18 19:13:53 2019@author: Lenovo"""import pandas as pdimport numpy as np#import itertoolsfrom keras.layers import *from keras.models import *...原创 2019-02-19 09:55:48 · 508 阅读 · 0 评论 -
Canny边缘检测算法的实现
图像边缘信息主要集中在高频段,通常说图像锐化或检测边缘,实质就是高频滤波。我们知道微分运算是求信号的变化率,具有加强高频分量的作用。在空域运算中来说,对图像的锐化就是计算微分。由于数字图像的离散信号,微分运算就变成计算差分或梯度。图像处理中有多种边缘检测(梯度)算子,常用的包括普通一阶差分,Robert算子(交叉差分),Sobel算子等等,是基于寻找梯度强度。拉普拉斯算子(二阶差分)是基于过零点检...原创 2019-02-20 10:07:46 · 2205 阅读 · 1 评论 -
用C++搭建三层神经网络
C++写三层神经网络:整体网络框架搭建:bp.h#include <vector>// #define LAYER 3// #define NUM 10const int NUM = 10;const int LAYER = 3;using namespace std;struct Data{ vector<double> x;...原创 2019-01-02 13:36:17 · 963 阅读 · 1 评论 -
【Keras】GAN神经网络
参考文献:主要参考这篇文章 Generative Adversarial Networks, link为了方便说明和研究,我这里只是设计了一个非常简单的模型,对高斯分布样本进行生成。不过从下面的实验中,我还是发现了一些非常有用的特点,可以加深我们对GAN网络的了解。GAN原理具体原理可以参考上面的文献,不过在这里还是大概讲一下。其实GAN的原理非常简单,它有2个子网络组成,一个是...原创 2018-11-15 10:58:40 · 2277 阅读 · 0 评论 -
【特征工程常用思路】人工智能辅助糖尿病遗传风险预测项目总结【LGB|XGB|神经网络】
预测算法1. LightGBM LightGBM利用基于histogram的算法,通过将连续特征(属性)值分段为discrete bins来加快训练的速度并减少内存的使用。直方图算法的基本思想:先把连续的浮点特征值离散化成k个整数,同时构造一个宽度为k的直方图。遍历数据时,根据离散化后的值作为索引在直方图中累积统计量,当遍历一次数据后,直方图累积了需要的统计量,然后根据直方图的离散值,遍...原创 2018-11-15 10:09:49 · 1229 阅读 · 0 评论 -
【VGG16】简历外观打分系统
很多新人在求职过程中,一直反复担心自己的简历外观怎么样,HR喜欢不喜欢,适合得体。于是想到开发一款简历外观打分系统,拍张简历的照片,即可打分。 第一步,数据采集,从各大网站爬下来【外观+下载量+价格】数据,如下所示:基础代码如下,没做优化,仅仅为了爬数据而已# -*- coding: utf-8 -*-"""Created on Thu Aug 30 13:00:3...原创 2018-09-27 12:23:53 · 379 阅读 · 0 评论 -
基于BiLinear的VGG16+ResNet50,用于细粒度图像分类
细粒度视觉识别之双线性CNN模型[1] Lin T Y, RoyChowdhury A, Maji S. Bilinear cnn models for fine-grained visual recognition[C]//Proceedings of the IEEE International Conference on Computer Vision. 2015: 1449-1457....原创 2018-09-20 19:23:02 · 4316 阅读 · 4 评论 -
用CNN巧妙解决金字塔滑动窗口,用cnn一边滑动一遍输出预测分类
效果如图:这是用cnn对一张305*471的图像做分类得到的结果,相当于做了52*93次滑动窗口+分类,却仅仅耗时0.2672951465708593s。相当于一次窗口分类 ,仅仅耗时 0.00005s。具体网络+预测如下图所示:import numpy as npimport cv2import timefrom keras.layers import Dense,Con...原创 2018-09-15 18:55:53 · 3691 阅读 · 3 评论 -
【深度学习】实时人眼 瞳孔追踪 系统
本来发论文只准备做一下 瞳孔分割的,采用U-net的形式,可是U-net在人眼上效果并不太好,于是对U-net进行了彻头彻尾的分析,改进了很多,基本只保留了一个U型结构,之后分割出来瞳孔以后,觉得是不是可以再做一点事情呢?看到很多人用椭圆拟合的方法去拟合瞳孔,但是这种方法有一个弊端就是 遮挡或者快速运动模糊状态下,无法检测到瞳孔,于是我自己开发了个一种形状自适应深度学习算法(AutoShaped ...原创 2019-03-20 14:57:26 · 5978 阅读 · 7 评论 -
AI面试官产品说明【Android APP开发 自然语言处理 图像处理 深度学习 人脸检测 面相分析 智能面试】
1.注册登录系统2.招聘信息中心系统【用于获得招聘信息,查看招聘详情,查看公司信息】3.简历系统【用于新建与完成简历编辑工作】4.面试系统【采用人工智能,自然语言对话开发的面试系统,包含 基于上下文提问,语义理解,语音文字实时转写,基于人脸68特征点的面相分析,基于人脸的情绪分析,基于简历的画像生成,人岗匹配度语义计算算法等】5.正常招聘流程【简历投递->参与面试->等...原创 2019-04-08 12:56:37 · 639 阅读 · 2 评论 -
干眼—图像增强算法 扭曲+噪声
# -*- coding: utf-8 -*-"""Spyder EditorThis is a temporary script file."""import PIL.Image as IMimport cv2import numpy as npimport matplotlib.pyplot as pltfrom scipy.ndimage.interpolation i...原创 2019-07-16 18:41:44 · 801 阅读 · 5 评论 -
Label Smoothing
标签平滑,作者说one-hot这种脉冲式的标签导致过拟合new_labels = (1.0 - label_smoothing) * one_hot_labels + label_smoothing / num_classesSzegedy在网络实现的时候,令 label_smoothing = 0.1,num_classes = 1000。Label smooth提高了网络精度0.2%...原创 2019-07-16 11:39:43 · 425 阅读 · 0 评论 -
仿射和弹性变换(affine and elastic transform)的python实现
https://blog.csdn.net/maliang_1993/article/details/82020596仿射变换:相当于对于图像做了一个平移、旋转、放缩、剪切、对称。与刚体变换相同的是,可以保持线点之间的平行和共线关系。即,原来平行的直线变化后还是平行的。但是和刚体变换不同的是线段之间的长度会发生变化。仿射变换是指在几何中,一个向量空间进行一次线性变换并接上...转载 2019-07-15 19:08:16 · 1156 阅读 · 0 评论 -
Faster RCNN 泪膜破裂 检测 深度学习方案
原创 2019-06-22 21:09:30 · 634 阅读 · 0 评论 -
FRCNN 泪膜破裂检测
FRCNN是目标检测网络,这次我把他用到了泪膜破裂检测上。效果图:原创 2019-06-18 09:51:00 · 923 阅读 · 3 评论 -
干眼检测 地形图提取 python opencv 图像处理
效果# -*- coding: utf-8 -*-"""Created on Mon May 27 13:40:10 2019@author: Administrator"""import cv2from PIL import Image as IMimport numpy as npfrom skimage.exposure import adjust_...原创 2019-05-27 19:03:39 · 666 阅读 · 0 评论 -
【三红外探测】人眼视线 估计
原创 2019-05-20 15:47:14 · 664 阅读 · 0 评论 -
基于CUDA的多聚焦融合算法
效果图:原图1:这里取巧了点,用Keras的CUDA来做的图像融合。也可以直接用numba或者pyCUDA# -*- coding: utf-8 -*-"""Created on Thu Apr 25 12:58:24 2019@author: Administrator"""from keras.layers import *import numba ...原创 2019-04-25 15:03:40 · 443 阅读 · 0 评论