自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(4)
  • 收藏
  • 关注

原创 chatgpt视觉理解文档

虽然它确实理解图像中物体之间的关系,但它还没有优化以回答关于图像中某些物体位置的详细问题。例如,你可以问它一辆汽车是什么颜色,或者根据你冰箱里的东西对晚餐有什么想法,但如果你给它看一个房间的图像,并问它椅子在哪里,它可能不会正确回答问题。一个好的经验法则是,如果普通人在低/高分辨率模式下无法看到图像中的信息,那么模型也不能。虽然具有视觉功能的GPT-4功能强大,可以在许多情况下使用,但重要的是要了解模型的局限性。不,你可以使用dall-e-3来生成图像,使用gpt-4-turbo来理解图像。

2024-05-09 17:50:06 878

原创 Openai模型种类概述

OpenAI API由一组具有不同功能和价格点的不同模型驱动。您还可以通过微调对我们的模型进行自定义,以满足您的特定用例。

2024-05-09 15:04:13 327

原创 NeRF常用评价指标:PSNR、SSIM、LPIPS详解

在b站看了up主:意の茗 的讲解视频,也查阅了LPIPS文献原文,做了如下笔记总结。

2023-07-16 03:48:46 2114 2

原创 沈向洋:如何以正确方式打开一篇科研论文?演讲总结

计算机视觉领域的著名学者 Don Geman 曾经说,一篇文章可以分为标题、摘要、引言、论文主体四个部分,每一部分都需要花同样的时间进行撰写。这个说法虽然夸张但是不无道理,因为大多数读者实际上最关注的就是文章开始的两页纸。对读者而言,看完前两页就知道这篇文章是不是值得去读;对reviewer而言,看完开头就知道能不能拒绝这篇文章。接下来,我将介绍如何读摘要。计算机学科论文中的摘要一般有固定格式,读起来非常枯燥。所以,要读摘要的时候,将其分解并加上一些有趣的亮点,可能有利于阅读。

2023-07-11 12:00:44 115 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除