自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

chenyang2203的博客

阅读/记录/思考/分享

  • 博客(20)
  • 资源 (4)
  • 收藏
  • 关注

转载 【CV】比较yolov5和yolov8: 在实际应该中应该选用哪个版本?

在物体检测领域,YOLO(You Only Look Once)是一种突破性的算法。YOLO算法自问世以来,已经演化出多个版本,其中最流行的两个版本是YOLOv5和YOLOv8。这两个版本都具有独特的功能和优势,使它们各具特色。在这篇文章中,我们将比较 YOLOv5 和 YOLOv8,看看哪个在准确率和 FPS 方面更好。

2024-06-27 14:09:34 408

原创 [工具环境] pip&git lfs下载命令

由于模型文件比较大,可以先下载指针文件,然后再下载lfs文件,这样可以实时显示下载速度和进度。中存放,可以通过git lfs进行下载。查看是否安装,如未安装可参考。目前大部分开源大模型都在。

2023-05-26 19:00:35 1361

原创 [论文] LIMA: Less Is More for Alignment

基于GPT的生成式大语言模型,在预训练阶段通过对海量数据的无监督学习,得到语言生成能力和对世界知识的存储能力,这一步相当于是在「练内功」,预训练之后的微调和对齐训练是对语言模型能力的挖掘和激活,引入各种任务数据进行微调训练,相当于是「练招式」,只有内功强大,才能更好凸现武术招式的厉害。在微调训练阶段,只是在进一步激活模型的潜在性能,通过本论文可以看到,微调样本量对生成结果质量并不是关键因素,在微调阶段,更应该关注于微调样本的多样性和数据质量。此外,模型对训练数据中的未见过的数据也能有较好的泛化。

2023-05-23 18:36:38 495

原创 [AI医学] llm-medical-data:用于大模型微调训练的医疗数据集

医疗数据集,大模型微调训练:llm-medical-data 用于大模型微调训练的医疗数据集该项目主要参考了...

2023-05-19 19:48:03 1048

原创 [AI医学] 医学领域几个微调&预训练大模型的项目

一是对海量领域数据继续进行生成式语言模型预训练(continue pretrain);二是在通用大模型的基础上引入领域数据进行指令微调训练(通用大模型底座+领域数据指令微调);生成式语言模型继续预训练对数据量和计算资源的要求较高,目前大部分项目的工作多是集中在对通用模型进行领域数据指令微调训练。在指令微调训练方面,差异性的工作主要表现在「领域样本数据的生成」(如各种self-instruct生成样本)和「低资源训练」上(如各种PEFT方法进行部分参数的微调)。医学领域大模型建设是有其必要性的。

2023-05-15 19:23:05 4513 1

原创 [AI医学] ChatDoctor:借助医学知识库生成微调样本构建医疗领域大模型

借助医学知识库生成微调样本构建医疗领域大模型chatDoctor, 在LLaMA模型的基础上进行fine tuning训练,样本数据采用100k在线真实医患对话,同时加入自主知识检索能力...

2023-05-12 16:01:57 794

原创 [AI医学] 领域指令微调样本生成框架OpenGPT与医疗健康大模型NHS-LLM

创建基于领域数据的指令微调样本,并在底座大模型上进行指令微调的一个开源框架。使用该框架,作者对医疗健康数据NHS生成指令微调样本,并在LLaMA的基础上进行微调训练,得到医疗健康大模型NHS-LLM

2023-05-12 11:12:56 716 1

原创 [话题] 讯飞星火与chatGPT对话题的自动回复对比 #讯飞星火大模型将超越chatgpt?#

话题#讯飞星火大模型将超越chatgpt?#使用星火和chatgpt分别对话题问题进行回答,看看效果如何~

2023-05-11 15:31:31 858

原创 [大模型] LLaMA系列大模型调研与整理-llama/alpaca/lora(部分)

llama系列大模型调研及关键信息整理,llama/standford-alpaca/alpaca-lora/chinese-llama-alpaca/belle等

2023-05-11 11:34:48 4163 2

原创 [大模型] 搭建llama主流大模型训练环境

搭建llama大模型GPU训练环境,用于llama及其衍生模型的训练与微调

2023-05-10 19:22:19 4203

原创 [大模型] 部分开源大模型调研及提纲式关键信息整理

主要的开源大模型提纲式整理

2023-05-09 19:45:05 300

原创 [环境工具] 搭建OPENAI API访问环境

建立open api访问环境

2023-05-08 19:23:20 2995 2

原创 [踩坑记] CUDA环境下bitsandbytes安装报错/异常解决

部署大模型LLaMA的过程中安装量化工具包bitsandbytes问题解决

2023-05-06 19:27:18 24129 4

原创 [评估指标] 敏感性/特异性/PPV/NPV等指标原理与计算方法

机器学习指标准确率、精确率、召回率,临床评估指标PPV、NPV、敏感性、特异性等

2023-05-06 14:59:05 4582 1

原创 [踩坑记] xgboost预测概率雷同问题分析与解决

模型预测概率结果总是一样,问题排查与解决

2023-04-28 10:57:24 995

原创 [ACL2019 Best Paper] Bridging the Gap between Training and Inference for Neural Machine Translation

ACL2019 Best Long Paper解读:目的:解决训练数据的Teacher Forcing问题 训练时使用true ground数据,而推断时使用预测结果作为上文,在训练时会造成overcorrection(同义词结果被过度矫正) 提出在训练时不仅仅使用true ground label,还会结合oracle word作为上下文,结构如下:在原始NTM的基础上,在j时,输...

2019-09-29 12:22:20 1703 2

转载 Mac python虚拟环境

安装python3brew install python3更新pip源配置建立pip配置文件cd ~mkdir .pip; cd .pip; touch pip.conf;在pip.conf中增加以下配置项,使用清华pip源[global]index-url = https://pypi.tuna.tsinghua.edu.cn/simple/[install]tru...

2019-07-15 20:09:12 632

转载 转:【OpenCV入门教程之十】 形态学图像处理(一):膨胀与腐蚀

本系列文章由@浅墨_毛星云 出品,转载请注明出处。   文章链接: http://blog.csdn.net/poem_qianmo/article/details/23710721 作者:毛星云(浅墨)    邮箱: happylifemxy@163.com  写作当前博...

2019-04-10 12:16:37 192

原创 解决mac pycharm opencv-python 函数信息不提示

环境:mac + python3.6.4 + opencv-python4.0 + pycharm在pycharm中通过以下命令安装opencv python版:pip install opencv-python在pycharm中建立工程后不能对函数信息自动提示,解决方法如下:1)修改python环境下lib/python3.6/site-packages/cv2/__init_...

2019-04-01 21:09:18 1651 2

翻译 【NLP+医学】Evaluation and accurate diagnoses of pediatric diseases using artificial intelligence

Paper From:Nature Medicine 2019Paper URL:https://www.nature.com/articles/s41591-018-0335-9主要内容提出了一套「疾病确认」的计算框架,用于对儿科疾病进行自动化分类。如上图:EHRs: 数据源EHRs(电子健康记录)包括「主属、现病史、各种检验检查报告」;knowledge-based text...

2019-02-18 20:29:27 1445 8

C代码实现所有《数据结构》算法

所有的《数据结构》的算法,很好很好,感谢编写者!

2009-05-14

机器学习(Mitchell)

Mitchell的《机器学习(中文版)》课件(ppt)

2009-03-15

C语言写的万年历(DEVC++下)

c语言写的万年历 1、输入(year):全年日历 2、输入(year month):本月日历 3、输入(year month day): 该天信息,包括是星期几 该年的第几周 该年的第几天 4、退出

2009-03-15

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除