人工智能篇
文章平均质量分 92
人工智能
rs勿忘初心
刻意练习,享受创造的快乐。公众号:rs勿忘初心
展开
-
快速了解GPT-4o和GPT-4区别
在5月14日的OpenAI举行春季发布会上,OpenAI在活动中发布了新旗舰模型“GPT-4o”!据OpenAI首席技术官穆里·穆拉蒂(Muri Murati)介绍,GPT-4o在继承GPT-4强大智能的同时,进一步提升了文本、图像及语音处理能力,为用户带来更加流畅、自然的交互体验,更多详情可点击查看官网(需科学上网)。GPT-4o的“o”代表“omni”,源自拉丁语“omnis”。在英语中“omni”常被用作词根,用来表示“全部”或“所有”的概念。GPT-4o是一个多模态大模型。原创 2024-06-28 10:08:21 · 2797 阅读 · 1 评论 -
ubuntu下配置SSD网络全过程
The Single Shot Detector(SSD)是 UNC Chapel Hill(北卡罗来纳大学教堂山分校) 的 Wei Liu 大神在2016的ECCV上面提出的,论文题目《SSD:Single Shot MultiBox Detector》,项目代码地址:https://github.com/weiliu89/caffe/tree/ssd 网址里面有详细...原创 2018-03-28 16:56:34 · 2228 阅读 · 0 评论 -
神经网络中的前向和后向算法
看了一段时间的深度网络模型,也在tf和theano上都跑了一些模型,但是感觉没有潜下去,对很多东西的理解都只停留在“这个是干什么的”层次上面。昨天在和小老师一起看一篇文章的时候,就被问到RNN里面的后向传播算法具体是怎么推。当时心里觉得BP算法其实很熟悉啊,然后在推导的过程中就一脸懵逼了。于是又去网上翻了翻相关内容,自己走了一遍,准备做个笔记,算是个交代。准备一个神经网络模型,比如:转载 2017-12-21 16:24:45 · 3013 阅读 · 0 评论 -
ubuntu16.04下Caffe绘制训练过程的loss和accuracy曲线
在利用Caffe训练相应的网络模型后,往往需要绘制训练过程中的数据,这样可以更加直观地展示我们的实验结果,事实上,caffe自带了这样的小工具,当然你也可以自己写个代码,下面分别介绍这两种方法: (一)利用caffe自带工具 (1)首先假设你生成的log文件名为train.log,利用你的~/caffe/tools/extra/parse_log.py来解析trai...原创 2018-05-21 11:04:35 · 892 阅读 · 0 评论 -
深度学习应用场景整理
这些应用场景都是商汤科技目前的核心技术实现,商汤科技是一家提供企业级产品的AI技术公司,其专注的领在于计算机视觉和深度学习,目前主要精力投放在移动互联网、安防、金融领域,目前也在智能硬件、医疗、教育等业务线在快速布局。人脸技术 人脸检测跟踪人脸关键点定位人脸身份认证人脸属性人脸聚类真人检测人脸美容/美妆图像识别 服装属性识别物体识别场景识别车型识别智能监控 行人车辆检测行人属性人群分析文字识别 文...转载 2018-05-14 12:55:25 · 16977 阅读 · 0 评论 -
labelImg(pyqt4 )出现错误(segmentation fault(core dumped) )
在配置labelImg的过程中,最后执行时候出现了一个错误segmentation fault(core dumped) .解决方法: 将安装的pyqt4的版本从4.11.4降到4.11.3版本,会发现对应的qt和sip也跟着改变了。执行命令:conda install pyqt=4.11.3 然后执行在对应目录下执行:python labelImg.py 我...原创 2018-03-28 22:19:14 · 1457 阅读 · 0 评论 -
ubuntu16.04配置opencv2、python2、cuda8.0、cudnn以及caffe
opencv安装(1)安装编译工具以及依赖包安装编译工具:sudo apt-get install build-essential 安装依赖包:sudo apt-get install cmake git libgtk2.0-dev pkg-config libavcodec-dev libavformat-dev libswscale-dev 安装可选包:sudo apt-get instal...原创 2018-05-03 15:07:30 · 469 阅读 · 0 评论 -
ubuntu16.04开机只显示桌面背景鼠标解决方法
前几天重新安装了下ubuntu 16.04,然后配置好了caffe+cuda8.0+cudnn5.1+opencv2.4.13等环境,然后更新了下软件,即在终端执行了:sudo apt-get updatesudo apt-get upgrade 一切正常,看了看表,快十一点了,然后就关机回去洗洗睡了。然而第二天开机发现只显示背景桌面和鼠标,其它所有的东西都不见了,...原创 2018-05-09 10:46:40 · 34594 阅读 · 31 评论 -
python调用caffe时,出现ImportError: No module named _caffe
一个看似很简单的问题,折腾了我好久,今天恍然大悟,当然是自己太low,理解不够深入。 作为一个业余的小白,半年前配置了ubuntu 16.04 +CUDA8.0 +caffe+opencv 2.13 +CUDNN5.1环境,并顺利的跑通了SSD、FlowNet2.0等深度学习框架,当然东查西查也花了很久时间,然后就在此环境基础上用的很顺利,前几天不小心删除了和输入法相关的ibu...原创 2018-05-08 21:14:46 · 20570 阅读 · 4 评论 -
caffe特征可视化---python实现
这里主要测试了一下如何对利用caffe的python接口对特征进行可视化,从一次forword中取出param和blob里面的卷积核 和响应的卷积图。我主要是对caffe/models/bvlc_reference_caffenet/路径下的模型和网络配置文件进行了测试,模型为bvlc_reference_caffenet.caffemodel,配置文件为:deploy.prot...原创 2018-04-17 10:43:44 · 1616 阅读 · 0 评论 -
光流Optical Flow介绍与OpenCV实现
光流(optic flow)是什么呢?名字很专业,感觉很陌生,但本质上,我们是最熟悉不过的了。因为这种视觉现象我们每天都在经历。从本质上说,光流就是你在这个运动着的世界里感觉到的明显的视觉运动(呵呵,相对论,没有绝对的静止,也没有绝对的运动)。例如,当你坐在火车上,然后往窗外看。你可以看到树、地面、建筑等等,他们都在往后退。这个运动就是光流。而且,我们都会发现,他们的运动速度居然不一样?这就给我们转载 2017-05-26 17:07:03 · 932 阅读 · 0 评论 -
pycharm出现KeyError:“Couldn't find filed google.ptotobuf.FileOption.javanano_use_deprecated_package”
电脑ubuntu16.04系统本来一直用的是caffe,出于好奇,试着装了下tensorflow,结果出了些问题,然后按网上的方法东整西整,发现自己的python都用不了了,在pycharm里面出现如下错误: KeyError:“Couldn't find filed google.ptotobuf.FileOption.javanano_use_deprecate...原创 2018-04-19 10:35:54 · 1321 阅读 · 0 评论 -
yolov3运行及保存检测视频(包括摄像头)
新代码:可用,如果不想在老代码上折腾更改,可以直接根据下面的新地址拉取代码。 (注意看Readme)--------------------更新20180703-----------------由于以前上传的项目有点点小问题,完整更新项目及说明如下链接。https://github.com/RongSong1993/YOLOv3-SaveVideo-New/tree/master...原创 2018-04-16 19:55:03 · 57135 阅读 · 63 评论 -
人脸检测之Haar分类器方法
浅析人脸检测之Haar分类器方法一、Haar分类器的前世今生 人脸检测属于计算机视觉的范畴,早期人们的主要研究方向是人脸识别,即根据人脸来识别人物的身份,后来在复杂背景下的人脸检测需求越来越大,人脸检测也逐渐作为一个单独的研究方向发展起来。 目前的人脸检测方法主要有两大类:基于知识和基于统计。Ø 基于知识的方法:主要利用先验知识将人脸看作器转载 2017-05-09 16:42:23 · 459 阅读 · 0 评论 -
图像识别及处理相关数据集介绍
原文链接:http://blog.csdn.NET/qq_14845119/article/details/51913171ImageNet ImageNet是一个计算机视觉系统识别项目,是目前世界上图像识别最大的数据库。是美国斯坦福的计算机科学家李飞飞模拟人类的识别系统建立的。能够从图片识别物体。目前已经包含14197122张图像,是已知的最大的图像数据库。每年的转载 2017-05-02 10:31:07 · 46637 阅读 · 0 评论 -
【机器学习】MATLAB读取mnist数据库
原文出处:http://blog.csdn.net/tracer9/article/details/51253604最近要做《优化理论基础》的课程大作业,需要用到mnist这个手写识别数据库,在网上查了一下如何使用,分享在这里,以飨读者。mnist是纽约大学(NYU)Yann Lecun在上个世纪90年代做的一个关于手写数字识别的数据库。该数据库提出的Motivation是为了解决原创 2017-04-08 11:25:41 · 6515 阅读 · 1 评论