自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

herosunly的博客

阿里云天池大赛安全恶意程序检测第一名,科大讯飞比赛第一名,热衷于机器学习算法研究与应用。

  • 博客(621)
  • 资源 (162)
  • 收藏
  • 关注

原创 大模型微调部署实战及类GPT工具的高效使用

本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 专栏亮点3. 你的收获4. 详细目录

2024-07-24 07:00:00 58148 72

原创 详解大模型微调数据集构建方法(持续更新)

本文详细介绍了大模型微调数据集构建方法,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 微调数据集构建方法 2.1 方法一 2.2 方法二 2.3 方法三 2.4 方法四

2024-06-05 07:30:00 114577 55

原创 大模型LoRA微调调参的实战技巧(持续更新)

本文主要介绍了大模型LoRA微调调参的实战技巧,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧

2024-05-01 12:08:15 90245 61

原创 惠普战99移动工作站: 第十三代英特尔酷睿处理器和惠普一站式AI应用开发方案的完美融合

惠普作为全球移动工作站领域的领军企业,一直致力于移动工作站的研发与创新。在万众瞩目的期盼下,惠普终于推出了最新款的移动工作站:2023款的战99酷睿版移动工作站。该款移动工作站是一款各方面表现都非常优秀的产品,集高性能、安全性、接口全、长续航、高耐用等特点于一身。这款耐用的高端设备具备增强型协作特性和专业级组件,不仅可快速运行CAD、3D创作、建模和渲染等专业软件应用,而且精心打造了惠普数据科学:一站式AI应用开发方案,极大提升了数据分析和可视化、机器学习的使用效率。

2023-09-26 15:47:51 98275 283

原创 百度智能云:千帆大模型平台接入Llama 2等33个大模型,上线103个Prompt模板

今天给大家带来的是百度智能云:千帆大模型平台接入Llama 2等33个大模型,上线103个Prompt模板,希望能对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 大而全+持续进化的大语言模型平台3. Prompt海量模板库助力优化模型效果4. 总结

2023-08-11 22:54:04 37094 149

原创 参加2021年CSDN博客专家颁奖仪式的收获

文章目录1. 活动简介2. 博客创作心得1. 活动简介  作为CSDN的博客专家,非常荣幸能够参加本次CSDN开发者生态汇以及博客专家的颁奖仪式,感谢CSDN一直以来的支持与认可。  主持人是由CSDN的邹总担任的。邹总的《编程之美》、《构建之法》深得程序猿们的喜爱。  开场演讲是由CSDN的蒋总,标题是开源开放 共建开发者新生态。其中关键词为开源、共建、生态。开源和共建的本质是团结,而生态是构建生态系统以及完整的产业链。  蒋总先复盘过往,然后再基于数据和逻辑预测未来,其中讲到了开发者市场正

2022-03-31 21:29:56 42791 150

原创 保姆级人工智能学习成长路径

0. 前言1. 第一阶段:编程语言学习2. 第二阶段:机器学习基本理论3. 第三阶段:深度学习理论与实战4. 第四阶段:细分领域深入学习5. 第五阶段:集大成者  最近有很多小伙伴想学习人工智能,其中不少同学渴望从事相关职业。虽然网上的资料很多,但是很多内容不够接地气,导致他们看不懂,所以很迷茫,不知何去何从。作为获得AI比赛Top名次的老司机,就给大家讲讲如何系统学习人工智能,最终达到一名合格的算法工程师。希望大家能够跟随我一步步迈进人工智能的殿堂,一起冲鸭~~~...

2021-07-02 07:32:29 20640 114

原创 阿里云安全恶意程序检测冠军经验分享(万字长文)

  最近收到不少收费用户的私信,想要学习我是如何拿到阿里云安全恶意程第一名的优异成绩的经验。大家渴望学习的热情感染了我,所以特意整理了一篇详尽的经验分享博客,希望能对大家有所帮助。文章目录1. 任务描述2. 数据统计分析3. 方案设计3.1 单模型设计3.1.1 传统机器学习3.1.1.1 特征工程3.1.1.2 分类器3.1.2 深度学习3.1.2.1 深度学习模型设计3.1.2.2 深度学习模型训练3.2 模型融合3.3 线上部署4. 总结1. 任务描述  将windows可执行程序在动态沙箱

2021-02-04 19:54:33 159930 127

原创 AI比赛经验分享 - 总目录

总目录1. 不同方向经验分享1.1 NLP1.2 CV1.3 语音1.4 结构化数据1.5 时序预测1.6 网络安全方向1.7 推荐与广告1.8 风控2. 工具和提分技巧分享3. 个人比赛体会

2020-12-11 13:30:50 121884 73

原创 机器学习之学习路径、学习方法、常用工具、Python、Numpy、pandas、sklearn、Tensorflow、Pytorch、Git入门教学大纲

学习方法核心思想Python基础2.1 Python运行环境(Jupyter Notebook)2.2 编程规范2.3 基本语法2.4 函数式编程2.5 面向对象2.6 文件操作数据处理常用库Numpy数据处理常用库Pandas(DataFrame、Series等)Linux常用命令Git和Github.........................................................

2020-10-09 20:17:28 14594 61

原创 AIGC实战之如何构建出更好的大模型RAG系统

本文介绍了如何构建出更好的大模型RAG系统,希望能对学习大语言模型和RAG的同学们有所帮助。文章目录1. 前言2. S1 初级RAG3. S2 高级RAG 3.1 模型测 3.2 策略测 3.3 模型微调测4. S3 超级RAG5. 本书作者6. 内容简介7. 购买链接

2024-09-20 15:18:18 1381 5

原创 详解大模型多轮对话的数据组织形式

本文主要介绍了详解大模型多轮对话的数据组织形式,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. LLaMA Factory适配的多轮对话数据形式3. SWIFT适配的多轮对话数据形式

2024-09-06 07:30:00 4253 40

原创 调用Claude 3.5 API的实战代码

本文主要介绍了调用Claude 3.5 API的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战代码

2024-09-04 18:30:37 10978 22

原创 windows系统huggingface连接不上的解决方案

本文主要介绍了windows系统huggingface连接不上的解决方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 解决方案 2.1 解决方案一 2.2 解决方案二

2024-09-01 21:07:28 13397 28

原创 Langchain-Chatchat本地部署的解决方案

本文主要介绍了Langchain-Chatchat本地部署的解决方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库3. 启动xinference4. 启动Langchain-Chatchat

2024-08-28 10:21:15 17598 21

原创 基于华为昇腾910B和LLaMA Factory多卡微调的实战教程

本文主要介绍了基于华为昇腾910B和LLaMA Factory多卡微调的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 安装虚拟环境 2.2 安装依赖库 2.3 模型选型与下载 2.4 配置多卡环境3. 运行代码 3.1 构建训练数据 3.2 修改配置文件 3.3 继续预训练(CPT) 3.4 SFT

2024-08-23 22:26:47 20925 32

原创 编程“奥斯卡”落幕,百度之星决赛中学生疯狂收割大奖!

大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。8月18日,被称为“技术界奥斯卡”的2024百度之星程序设计大赛(以下简称“百度之星” )落下帷幕。

2024-08-20 17:29:33 24186 32

原创 《智能计算系统:从深度学习到大模型(第2版)》重磅上市!

本文主要介绍了大模型优质书籍《智能计算系统:从深度学习到大模型(第2版)》,希望能对学习大模型的同学们有所帮助。文章目录1. 前言2. 书籍推荐 2.1 内容简介 2.2 本书作者 2.3 专家推荐 2.4 读者对象 2.5 本书目录3. 购买链接

2024-08-20 14:56:34 10143 10

原创 预训练PDF数据格式转换

本文主要介绍了预训练PDF数据格式转换,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. PDF数据格式转换

2024-08-12 20:58:48 33724 45

原创 预训练网页数据爬取与预处理

本文主要介绍了预训练网页数据爬取与预处理,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 数据爬取与预处理

2024-08-04 22:40:37 51776 44

原创 优质书籍推荐:《码农职场:IT 人求职就业手册》——保姆级面试指南

本文主要介绍了优质书籍推荐:《码农职场:IT 人求职就业手册》——保姆级面试指南,希望能对同学们有所帮助。文章目录1. 前言2. 书籍推荐 2.1 内容简介 2.2 本书作者 2.3 本书目录3. 购买链接

2024-07-31 22:02:22 45747 29

原创 LLaMA Factory添加新模型template的实战解析

本文主要介绍了LLaMA Factory添加新模型template的实战解析,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战解析 2.1 检查代码 2.2 修改代码

2024-07-29 07:46:12 42773 28

原创 github连接不上的解决方案(持续更新)

本文主要介绍github连接不上的解决方案(持续更新),希望对使用github的同学们有所帮助。文章目录1. 背景2. 解决方案

2024-07-23 07:18:51 65792 22

原创 使用工作流产生高质量翻译内容的实战教程

本文主要介绍了使用工作流产生高质量翻译内容的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 思路分析3. 实战教程

2024-07-22 07:00:00 50128 18

原创 探寻大模型回答9.9和9.11犯错的根本原因

本文主要介绍了探寻大模型回答9.9和9.11犯错的根本原因,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 分析与思考

2024-07-18 19:30:00 50530 40

原创 通过命令行工作流提升工作效率的实战教程(持续更新)

本文主要介绍了通过命令行工作流提升工作效率的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 配置环境 2.1 可选步骤一 2.2 步骤二 2.3 步骤三3. 实战案例

2024-07-16 23:17:19 54600 33

原创 AI绘画Midjourney从入门到实战应用

本文主要介绍了AI绘画Midjourney从入门到实战应用,希望能学习AIGC的同学们有所帮助。文章目录1. 前言2. 《Midjourney从入门到实战应用》3. 购买链接

2024-07-15 07:15:00 54819 23

原创 大模型生成人物关系思维导图的实战教程

本文主要介绍了大模型生成人物关系思维导图的实战教程,希望对使用大语言模型的同学们有所帮助。文章目录1. 前言2. 实战教程

2024-07-13 09:26:53 56773 14

原创 大模型微调选择模型的实战技巧(持续更新)

本文主要介绍了大模型微调选择模型的实战技巧(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战技巧

2024-07-11 20:00:00 58250 19

原创 大模型文档神器:合合信息大模型加速器

本文主要介绍了大模型文档神器:合合信息大模型加速器,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. TextIn大模型 “加速器”简介3. 通用文档解析实践 3.1 理论及实践综述 3.2 在线体验 3.3 API实践4. 通用文本向量实践 4.1 理论综述及API简介 4.2 huggingface acge_text_embedding模型5. 大模型加速器行业应用

2024-07-10 07:00:00 78144 98

原创 AIGC时代程序员的跃迁——编程高手的密码武器

过去,没有合适的辅助工具,这几乎是一项艰巨的工程。在苹果手机高端机型默认开启HDR视频作为拍摄视频的模式后, 我们的一款APP便收到用户的使用反馈,上传到APP的视频,打开查看时颜色变得很暗淡。总的来说,AI在编程领域对程序员的帮助还是很大的,不会在每个方面帮助都大,但是在特定方面帮助尤其大,比如以上例举的两个例子:学习新技术,解决技术栈层次更深的问题,这可以解决大量的时间去查阅资料,去理解视频转码的每个参数的意思,尤其视频转码参数众多,理解每个参数都得花费不少的时间,还得挨个组合测试,总之,一级棒。

2024-07-08 14:29:24 53171 35

原创 Text2SQL提问中包括时间的实战方案

本文主要介绍了Text2SQL提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案

2024-07-07 17:46:33 64253 20

原创 第四届BPAA算法大赛成功举办!共研算法未来

他表示,算法模型技术依然是中国人工智能产业最为薄弱的要素区,想要形成合理可期的中模型发展生态,需要重视有限范围的中数据的打通应用,也需要更为成熟的算法模型客户群体。当天上午,来自工业、公共、金融、商业、医疗、S算法模型赛道(聚焦可持续发展领域项目)的五十强优秀项目进行了激烈角逐,最终决出6个金奖与12个银奖项目。作为人工智能领域的全球年度性赛事、世界人工智能大会三大品牌赛事之一,BPAA大赛未来将继续紧扣人工智能发展方向,引进优质资源,推进政校企合作,借助社会各界力量不断推动算法产业向前发展。

2024-07-06 17:35:59 65761 23

原创 大模型提问中包括时间的实战方案

本文主要介绍了大模型提问中包括时间的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 实战方案

2024-07-04 23:02:15 67066 19

原创 Text2SQL中反思纠错的实战方案

本文主要介绍了Text2SQL中反思纠错的实战方案,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 反思纠错的实战方案

2024-06-29 12:12:59 74678 40

原创 Text2SQL中不同数据库SQL之间转换的实战代码

本文主要介绍了Text2SQL中不同数据库SQL之间转换的实战代码,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. SQL转换实战代码

2024-06-27 18:08:19 76489 21

原创 BPAA第四届全球应用算法典范大赛TOP 50榜单出炉

本文主要介绍了BPAA第四届全球应用算法典范大赛TOP 50榜单出炉,希望对学习大语言模型的同学们有所帮助。文章目录1. BPAA第四届全球应用算法典范大赛2. 第四届全球应用算法模型典范大赛创业组TOP 50榜单3. 第四届全球应用算法模型典范大赛创新组TOP 50榜单

2024-06-25 13:39:23 68565 36

原创 Text2SQL基座模型选择的实战教程(持续更新)

本文主要介绍了Text2SQL基座模型选择的实战教程(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. Text2SQL基座模型的发展史3. 模型选择实战 3.1 prompt模板 3.2 下载模型与部署API 3.3 实战代码4. 补充说明

2024-06-21 17:54:11 85603 33

原创 大模型微调和RAG的应用场景

本文主要介绍了大模型微调和RAG的应用场景,希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 大模型微调 vs. RAG

2024-06-19 22:56:48 88042 29

原创 大模型微调出错的解决方案(持续更新)

本文主要介绍了大模型微调出错的解决方案(持续更新),希望对学习大语言模型的同学们有所帮助。文章目录1. 前言2. 解决方案 2.1 大模型环境配置问题 2.2 实时观测GPU变化 2.3 微调卡住不动

2024-06-13 20:00:00 97199 32

加利福尼亚州住房数据集,包括九个特征和一个目标值即房价,总共20640条数据,和sklearn中的california数据集相同

包括了房屋的经度、房屋的纬度、房龄、房间个数、卧室个数、街区内人口、街区内家庭总数、收入、房屋价值,和sklearn中的california数据集相同,可直接通过pandas.read_csv读取即可,适合sklearn无法正常加载的情况下使用,其中加载代码如下 ```python from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() ```

2023-01-04

将PDF转换成图片的依赖库文件

将PDF转换成图片的依赖库文件

2022-04-07

考研英语和考研政治答题卡

考研英语和考研政治答题卡,值得考研同学借鉴学习。尤其是考研英语的作文区域是画好了格子,考研政治的大题是空白区域,建议大家可以购买考研专用尺画线。

2022-03-24

哈工大ltp模型文件(3.4.0)

哈工大ltp模型文件(3.4.0)

2022-03-04

台湾清华大学微积分详细笔记

总共31个PDF文件。其中重点并详细介绍了如何高效学习微积分、极限、连续、微分、积分等核心概念。内容详尽,值得深入学习。

2022-03-02

企业网络资产及安全事件分析数据集

包含tcpflow、flow、db、login四个文件夹,tcpflow是记录TCP协议层的数据传输记录,flow日志是http请求中header的数据记录,db日志是记录数据库操作的日志(SQL语句的执行记录),login日志是记录登录结果的日志(包括POP、FTP、SMTP、SMB和数据库的登录记录)。

2022-02-23

MalwareTextDB数据集

MalwareTextDB数据集

2022-02-15

网络空间安全:挑战和机遇

网络空间安全:挑战和机遇,共46页PPT,内容详尽,值得深入学习。

2022-01-19

西安电子数字信号处理(高西全丁美玉第三版)课后答案

西安电子数字信号处理(高西全丁美玉第三版)课后答案,共37页word文档,内容详尽,值得深入学习。

2022-01-19

系统认证风险预测数据集

包括认证时间、用户名、认证ID、操作类型、首次认证方式、IP地址、IP类型、IP威胁级别、地点、客户端类型、浏览器来源、浏览器类型、浏览器版本、操作系统类型、操作系统版本号、设备型号、应用系统编码、应用系统类目、风险标识等信息。

2022-01-19

基于UEBA的用户上网异常行为分析的数据集

基于UEBA的用户上网异常行为分析的数据集

2022-01-18

Autoruns开机启动项管理工具

Autoruns开机启动项管理工具

2022-01-04

2021年NLP面试题

2021年NLP面试题

2021-12-29

Gartner Emerging Technologies: Emergence Cycle AI in Security

Gartner报告,Emerging Technologies: Emergence Cycle AI in Security,2020年10月份出版的内容。

2021-12-02

计算机硬件清晰图(20MB)

计算机硬件清晰图

2021-11-29

使用机器学习和深度学习对PE进行二分类和多分类

通过大量训练数据来训练模型后进行保存,提供了保存后的模型和新数据的预测代码。

2021-08-05

cs231n第一个大作业

cs231n第一个大作业对应的最起始版本

2021-07-21

中文分词文件(共20W个词)

中文分词文件(共20W个词)

2021-06-23

英文单词分割symspellpy库依赖词典

symspellpy是可以进行文本的纠错,也可以将连在一起的字母分割成若干个单词的。根据实践表示该文件还是比较好用的,该文件是它的字典库。具体使用可参考博客https://blog.csdn.net/herosunly/article/details/105513582

2021-05-20

Iowa Liquor Sales 爱荷华州酒销售数据集

该数据集包含有关含酒精饮料的单个容器或容器包装的销售名称,种类,价格,数量和销售地点的信息。

2021-05-08

Transformer PPT

介绍了为什么要引入self-attention、self-attention的基本原理、self-attention的矩阵表示、Multi-head self-attention、 Positional Encoding、seq2seq

2021-04-22

安卓手机运行Python代码的apk文件.zip

安卓手机运行Python代码的apk文件,详细使用流程地址为https://blog.csdn.net/herosunly/article/details/115742190

2021-04-15

Linux安装boost 1.55.0安装包和文档

Linux安装boost 1.55.0安装包和文档

2021-04-14

现代汉语动词表(共2K条)

现代汉语动词表(共2K条)

2021-03-29

VSCode_User_win64_1.54.3

VSCode_User_win64_1.54.3

2021-03-29

CNEWS新闻文档分类数据

CNEWS新闻文档分类数据,其中14个候选分类类别:财经、彩票、房产、股票、家居、教育、科技、社会、时尚、时政、体育、星座、游戏、娱乐

2021-03-26

北京市房屋租赁合同(自行成交版)

北京市房屋租赁合同(自行成交版)

2021-03-22

知识图谱构建与实战PPT

知识图谱构建与实战PPT

2021-03-21

系统方法教你找到女朋友

系统方法教你找到女朋友

2021-03-18

.基于大数据的智能安全防御体系建设PDF

.基于大数据的智能安全防御体系建设

2021-03-18

人工智能之信息检索与推荐

人工智能之信息检索与推荐

2021-03-17

AI技术赋能网络内容安全保障研究报告

AI技术赋能网络内容安全保障研究报告

2021-03-17

mixed_corpus_bert_base_model.bin

mixed_corpus_bert_base_model.bin

2021-03-17

股票投资智慧(900页)

包括股票基本知识、股票估值方法、内在价值分析、公司财务分析、行业竞争分析、宏观经济分析等内容,值得深入学习。

2021-03-17

数字图像处理课件(冈萨雷斯第三版)PPT

数字图像处理课件(冈萨雷斯第三版)PPT

2021-03-17

Kafka核心知识点讲解.docx

Kafka核心知识点讲解

2021-03-17

人工智能赋能安全案例集(100多页)

人工智能赋能安全案例集,100多页,内容详尽,值得学习。

2021-03-17

nltk离线下载文件

NLTK离线下载文件,解压后可使用分词、停用词、词性标注和词形还原、wordnet等功能,NLTK安装可参考https://blog.csdn.net/herosunly/article/details/105017811中的0. 如何离线安装NLTK

2021-03-09

nlpcc2013和2014对应数据

nlpcc2013和2014对应数据

2021-03-05

信息安全思维导图集合(共24个图)

包括防御技术、攻击技术、职业发展路径、技能成长等内容。

2021-03-05

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除