红色石头Will-CSDN博客

原创快速入门——深度学习理论解析与实战应用

1. 前言记得是 2016 年 3 月 15 日，红色石头坐在下班的地铁上，跟往常一样，打开手机，看看新闻。突然，一条醒目的新闻吸引力我的注意：《AlphaGo 最终局战胜李世石人机大战总比分 1:4》！虽然，我之前也知道一点 AlphaGo，但是这条新闻着实让我比较惊讶。因为，它标志着人工智能第一次在围棋领域战胜了世界大师级别的选手！机器要逆天了？！AlphaGo 是谁？Alpha...

2018-07-11 21:01:54 14111 13

原创完结篇 | 吴恩达deeplearning.ai专项课程精炼笔记全部汇总

个人网站：红色石头的机器学习之路 CSDN博客：红色石头的专栏知乎：红色石头微博：RedstoneWill的微博 GitHub：RedstoneWill的GitHub 微信公众号：AI有道（ID：redstonewill）从去年8月份开始，AI界大IP吴恩达在coursera上开设了由5们课组成的深度学习专项课程，掀起了一股人工智能深度学习热潮。这...

2018-05-05 18:13:43 70543 12

原创终于等到了！国产神器上线，大模型开发者的“外挂”来了。。。

在技术网站发布本人真实的测评报告/使用tips/实际场景应用实例等经验帖，并提交到官方（下方海报二维码），通过验收的高质量测评可获得最高千元激励金。在 2D 平板受载问题求解中，飞桨。框架 3.0 自动并行训练 Llama2-13B 模型时，性能达 2055.8 tokens/秒，相比手动并行提升 5%，对比竞品 PAI 框架更是领先 28.3%以 DeepSeek R1 模型为例：。开发者无需精通底层通信逻辑，只需标记张量切分方式，框架自动推导最优并行策略，真正实现“写单卡代码，跑多卡训练”

2025-04-03 16:33:00 594

原创【李宏毅-生成式AI导论2024】公认最好的LLM大模型教程！

李宏毅教授的《生成式AI导论2024》是2024年春季在台湾大学开设的一门系统性课程，重点围绕生成式人工智能（Generative AI）的基础理论、技术演进及实践应用展开。

2025-03-24 13:57:42 401

原创全网疯抢的顶配 AI 神器！比肩 DeepSeek 让 AI 生图简单到离谱！

大家好，我是红色石头。前几天我的家庭群里突然炸锅：12岁的小弟居然@我："哥哥，B 站上都在推狸谱 App，这玩意儿是干啥的？" 紧接着，表妹甩出截图："这不就是那个能一键生成二次元图的神器吗！"从 B 站 UP 主到普通动漫迷，狸谱 App 彻底火出圈了。但问题来了：普通人如何体验这款二次元 AI 神器？直到上周，圈内大佬丢给我发了信息：狸谱 App 最新更新了"细腻 2.0"，号称"最好用的手...

2025-03-04 10:54:40 1484

原创刚刚！DeepSeek-R1 满血版，来了！

大家好，我是红色石头。今年春节开始，从开发者到普通用户，DeepSeek 彻底出圈了。但问题来了：普通人怎么用上顶配版 DeepSeek-R1 还能不卡顿？直到上周，圈内大佬丢给我个链接：火山引擎居然接入了 DeepSeek-R1 671B 满血版，而且"免登录、UI 超简单、延迟低至 20ms"。我这个 AI 工具老司机当场实测，结果……这玩意儿简直是 DeepSeek 用户的福音！直达车先上：...

2025-02-27 10:54:22 959

原创手把手薅到 DeepSeek-R1 671B 满血版，白嫖真香！

大家好，我是红色石头。前几天家庭群里突然炸锅：60 岁的老妈居然@我：“儿子，朋友圈都在转 DeepSeek，这玩意儿是干啥的？” 紧接着，表弟甩出截图：“微信刚接入的 AI 就是它！”从科技博主到广场舞阿姨，DeepSeek 彻底火出圈了。但问题来了：普通人怎么用上顶配版？直到昨天，圈内大佬丢给我个链接：问小白居然接入了DeepSeek-R1 671B 满血版，号称“不卡、零延迟、不限次、全免费...

2025-02-23 10:54:34 913

原创保姆级教程：30 秒部署 DeepSeek R1！供全民使用！

大家好，我是红色石头。最近 DeepSeek-R1 有多火就不用我再多费口舌形容了，但是官方网页版仍然不稳定！连续问两次必定会提示“服务器繁忙，请稍后再试”，真的很让人头疼。。。不过，因为 DeepSeek 是开源的，所以很多人想到了可以本地部署 R1，网上的资源也很多，我之前也专门写过文章发过教程。但是，很多小白曾经天真地以为，本地部署一个 DeepSeek R1 模型，无非就是买几块显卡、装...

2025-02-18 20:02:13 1714

原创通俗理解 K 近邻分类算法

引言想象一下，你是一个新学生，刚到学校，想找到一群志同道合的朋友。你可以观察班里的同学，根据他们的衣着、行为和喜好来判断谁更可能成为你的好朋友。这其实是我们在日常生活中分类的一个例子。在机器学习中，有一个类似的算法叫做K 近邻算法（K-Nearest Neighbors, KNN）。这个算法的核心思路是：物以类聚，人以群分。它通过计算数据点之间的距离，找出与目标数据点距离最近的 K 个邻居，并根据...

2024-12-06 10:54:27 1123

原创真是“离谱”！一键 AI 把宠物"灵魂提取"成二次元角色！狸谱彻底爆了！

最近，我在二次元交流群里被刷屏了！大家都在疯狂分享用微信小程序狸谱新出的《灵魂提取器》把自家猫猫狗狗变成二次元角色的作品。作为一个程序员，我第一反应是：这 AI 玩得有点意思啊！抱着尝鲜的心态，我决定拿家里那只"优雅"的猫咪试试。没想到，我立马被这个神器吸引住了！还记得前段时间刷爆全网的《换你来当爹》吗？没错，这次的《灵魂提取器》正是出自同一个团队 —— 狸谱。作为AI大模型公司"阶跃星辰"的生态...

2024-12-05 10:54:41 1101

原创训练大模型，这次竟卡在没图这里了。。。

作为一个 10 年经验的 AI 从业者，我一直相信这条铁律：在训练 AI 模型时，数据就是核心，不管是深度学习目标检测、图像分类、大模型训练，都毫无疑问需要大量图像样本作为支撑。可是，想要从网上抓到足够多的高质量图像数据，并不是一件轻松的事。直接使用爬虫爬取网络图片是常规办法。但是，直接暴力的爬虫方法可能会面临各种问题：1、IP 封禁：如果一个 IP 频繁访问同一个网站，尤其是短时间内抓取大量图片...

2024-11-22 10:55:39 658

原创深入理解机器学习中的正则化

引言在构建机器学习模型时，常常需要在模型的复杂度与泛化能力之间找到平衡。模型过于简单会导致欠拟合，而模型过于复杂又容易过拟合。正则化技术就是为了解决这一问题，它通过在模型的损失函数中加入额外的惩罚项，从而控制模型的复杂度，使得模型不仅能在训练数据上表现良好，还能有效地泛化到未见过的测试数据上。这篇文章将重点讨论机器学习中的L1 正则化（Lasso）和L2 正则化（Ridge）。1. 什么是正则化？...

2024-11-16 16:29:47 794

原创深入理解机器学习中的欠拟合与过拟合

引言在机器学习中，构建一个能够很好泛化的模型至关重要。我们希望模型不仅能在训练数据上表现优秀，还能在未见过的测试数据上取得相似的结果。然而，这个过程中我们常常会遇到两个常见的问题：欠拟合（Underfitting）和过拟合（Overfitting）。欠拟合就像是学生只看了课本的封面就去参加考试，没掌握足够的知识，导致考试成绩糟糕。过拟合就像是学生死记硬背了课本上的所有例题，却没有真正理解问题的本质...

2024-11-10 16:29:26 1199 1

原创全面盘点逻辑回归模型的 5 大评估指标

引言逻辑回归（Logistic Regression）是一种常用的分类算法。它的核心思想是通过一个线性模型来预测事件发生的概率，并使用逻辑函数（Sigmoid 函数）将结果映射到 [0, 1] 之间。在这篇文章中，我们将深入讨论逻辑回归模型的评估指标，包括准确率（Accuracy）、精确率（Precision）、召回率（Recall）、F1分数（F1 Score）以及ROC-AUC曲线。1. 常见...

2024-11-01 14:39:40 1464

原创深入理解逻辑回归算法理论与实战

引言在机器学习中，逻辑回归（Logistic Regression）是一种常用的分类算法，尤其适用于二分类问题。尽管名字中有“回归”二字，逻辑回归的主要目的是进行分类，而不是回归。逻辑回归通过使用线性模型来预测某个事件发生的概率，例如预测一封邮件是否是垃圾邮件、客户是否会购买产品等。本文将深入探讨逻辑回归的理论基础、数学公式、参数含义，以及如何使用梯度下降算法来实现这一模型。1. 逻辑回归的理论基...

2024-10-31 10:54:47 834

原创深入浅出梯度下降算法

引言在机器学习中，梯度下降算法（Gradient Descent）是一个重要的概念。它是一种优化算法，用于最小化目标函数，通常是损失函数。简而言之，梯度下降帮助我们找到一个模型最优的参数，使得模型的预测更加准确。本文将深入探讨梯度下降算法的原理、公式以及如何在Python中实现这一算法。1. 梯度下降算法的理论基础1.1 什么是梯度？在数学中，梯度是一个向量，表示函数在某一点的变化率和方向。在多维...

2024-10-29 11:09:53 957

原创回归模型评估指标

引言在机器学习中，回归模型用于预测连续数值，例如房价、温度或销售额。构建一个回归模型后，评估其性能至关重要。如何判断模型预测的准确性和可靠性？这就需要用到回归模型的评估指标。1. 常见的回归模型评估指标1.1 均方误差 (MSE)均方误差 (Mean Squared Error) 是最常用的回归模型评估指标之一，它计算模型预测值与真实值之间差异的平方的平均值。公式如下：其中：是真实值。是预测值。是...

2024-10-24 10:54:47 1887

原创深入理解多项式回归理论与实战

引言在机器学习中，回归分析是一种用于预测的统计方法，而简单线性回归适用于自变量和因变量之间存在线性关系的情况。但在许多实际问题中，变量之间的关系往往不是简单的线性关系，而是更复杂的非线性关系。此时，多项式回归（Polynomial Regression）可以作为一种有效的解决方案，它能够通过多项式的形式来建模和预测数据。1. 什么是多项式回归？多项式回归是一种扩展的线性回归模型，它可以通过引入自变...

2024-10-22 10:54:56 1232

原创深入理解简单线性回归理论与实战

引言在机器学习和统计学中，简单线性回归是一种基础而强大的工具，用于建立自变量与因变量之间的关系。假设你是一个房产中介，想通过房屋面积来预测房价。简单线性回归可以帮助你找到房屋面积与房价之间的线性关系，进而为客户提供更合理的报价。本文将带你深入了解简单线性回归的理论基础、公式推导以及如何在Python中实现这一模型。1. 简单线性回归的理论基础简单线性回归的基本假设是，因变量 Y（例如房价）与自变量...

2024-10-19 10:54:15 708

原创机器学习中的数据预处理：从原始数据到模型输入

引言机器学习中，数据预处理是一个至关重要的步骤。原始数据通常包含许多噪声、缺失值和不适合直接使用的格式。没有良好的数据预处理，模型的表现可能会大打折扣。本文将带你逐步了解数据预处理的几个关键步骤，包括如何导入数据集、处理缺失值、类别特征编码、划分训练集和测试集以及标准化。一、导入数据集在Python中，通常使用pandas库来导入和处理数据。pandas提供了强大的数据结构和函数，使数据操作变得简...

2024-10-18 10:54:28 969

原创从零开始搭建机器学习开发环境：PyCharm与Anaconda教程

引言今天，我将带你一步步完成 PyCharm 和 Anaconda 的安装与配置。Anaconda 是一个开源的Python发行版，带有丰富的数据科学工具集（包括NumPy、Pandas、Matplotlib、SciPy等），并且可以轻松管理虚拟环境。PyCharm 是一个功能强大的Python集成开发环境（IDE），支持代码调试、版本控制、代码补全等功能，极大地提高了开发效率。一、为什么选择An...

2024-10-17 10:54:37 1591 1

原创本硕 C9 计算机毕业：没有 996，一年到手 18 万，在电网待了 1 年后，肠子都悔青了......

“在电网待了 1 年，却后悔了！”近日，一位刚工作一年多的博主发了一条让人有些纠结的帖子，内容如下：这位楼主曾是 C9 高校计算机专业的本硕毕业生，毕业的时候，他并没有选择互联网大厂，而是出人意料地“躺平”了，来到了苏南的一家供电局工作。现在他每天工作稳定，朝九晚五，不需要担心 996 的焦虑，年薪也有 18 万左右。在很多人眼里，这无疑是一份“神仙工作”。可电网的工作虽然稳定，但日复一日，他感觉...

2024-09-04 10:55:06 1207

原创这是游戏科学创始人的履历，从网瘾少年到《黑神话：悟空》全球狂揽 15 亿。。。...

有谁能想到，一个曾经沉迷于《魔兽世界》、险些考研失败的网瘾少年，竟然能够在十年后带领他的团队创造出一款斩获 15 亿收入的国产单机游戏《黑神话：悟空》？看完了【扬声】栏目对《黑神话：悟空》创作人冯骥的采访，我对这位游戏科学的创始人充满了好奇。一、初识冯骥：从学霸到“网瘾少年”冯骥的故事从华中科技大学开始。这个毕业于生物医学工程专业的学霸，原本应该在实验室里搞科研、做研究，但他的职业生涯却偏离了轨...

2024-08-24 16:29:16 1453

原创一口气读完马斯克 8 小时访谈，bigmodel 居然能搞定 100 万长文本。。。

最近，公司业务上对长文本的需求显著增加，因为在 prompt 中需要塞入大量的 RAG 内容，供决策使用。这些召回的内容都有可能在决策过程中被用到，因此对大模型处理长文本的能力提出了更高的要求。在技术选型时，特别需要重点考察模型在处理长文本方面的表现。在总结收集各家大模型的“长文本”能力时，测试了市面上几款主流大模型，我发现它们普遍存在两个主要不足：首先，有些模型能够处理的文本长度仍然有限。尽管某...

2024-08-19 17:08:02 1675

原创亮数据：大模型训练效率提升100%

近两年来，AI 工具和大模型在全球迅速崛起，逐渐渗透到各行各业。无论是智能助手、数据分析，还是图像识别和自然语言处理，AI 工具的易用性使得越来越多的人可以轻松上手。与此同时，得益于开源社区和云计算的发展，训练大模型不再是大公司的专利。个人用户如今也可以利用现成的工具和平台构建自己的 AI 模型，无论是出于研究、创业还是个人兴趣。一、大模型训练基石：数据在训练大模型的过程中，数据扮演着至关重要的角...

2024-08-16 10:54:44 1414

原创小小橙篇，直接把我整个硬控住了！

作为一名 AI 知识型博主，之前学习一些专业知识，需要搜索大量博客、付费购买专业课程等。找资料就会花费很长时间，还要阅读全文、整理汇总，真的会耗费不少精力。不得不说，一款优秀的、适合自己的 AI 工具真的太重要了！不仅能大大提高我们日常学习、工作效率，还能给我们节省更多的“躺平”、“摸鱼”时间~到目前为止，我尝试过国内外十几种 AI 产品，包括目前营销铺天盖地的 Kimi。尽管如此，用起来总感觉不...

2024-07-31 10:54:25 714

原创太炸裂了！还得是讯飞。。。

就在刚刚，星火大模型又双叒叕要升级了！最新消息：讯飞星火大模型的 4.0 版本已于 27 号正式发布。这个新版本在底座能力上将全面与 GPT-4 Trubo 相匹敌，特别是在语音和图文识别方面，其性能有望实现显著飞跃。总之主打的就是：一个免费、功能强大、无需魔法开箱即用，对小白极度友好！6月26日，讯飞星火 APP 也推出了其最新版本4.0，我立刻进行了更新。官方使用入口：https://xing...

2024-06-28 09:02:00 989

原创天工 AI 3.0，彻底爆了！

作为一名 AI 博主，深知一个优秀的AI工具能大大提高我们日常学习、工作效率，比如我之前学习一些AI方向的算法知识，需要搜索大量博客、付费购买专业课程等。光在找到有用的资料就耗费不少时间了，更何况需要阅读全文去整理汇总，这对于个人的精力也是一种挑战。但如今，大模型的爆发已经持续很长时间了，相信不少朋友都已经用过各色各样的AI软件。但是整体体验下来或多或少还是有些人工智障。但是天工AI，在AI搜索...

2024-05-25 16:29:36 2320

原创 MiniMax 悄咪咪上线的这款 AI 产品，好用到爆炸！

大模型太卷了！上周国外某款多模态大模型的出现，立刻掀起了 AI 领域对话式多模态交互的热潮。不管是文字、语音，还是图片，都能与你进行实时交互。随后，谷歌也推出了类似的 Astra。然而，国外的交互式大模型，都存在一定的使用门槛。想用就用还真不是一件容易的事！好消息来了！一款具备相似功能的强大又低调的AI应用也悄然进行了更新。它就是——海螺 AI。这款产品是由大模型公司MiniMax推出的，主...

2024-05-24 11:07:23 1269

原创中国唯一！阿里云入选 UEC 技术委员会，携手微软、思科等打造 AI 网络基础设施...

各位小伙伴，今天咱们要聊一个大新闻！阿里云，国内 TOP 科技企业，成功入选了超以太网联盟（Ultra Ethernet Consortium, UEC）新一届技术委员会（TAC），成为唯一一家入选的中国企业。是的，你没看错，这不仅是科技圈的头条，也是中国企业的骄傲呀！作为一名阿里云使用者，我觉得必须给大家来一波硬核解析，咱们一起来感受这份荣耀背后的硬实力。一、超以太网联盟（UEC）简介说起超以太...

2024-05-15 10:56:01 1118 1

原创太炸裂了！还得是讯飞...

大家好，我是红色石头！这几天突然感慨：大模型发展太快了！几个月前还是 ChatGPT 一枝独秀，如今国内的大模型如雨后春笋版涌现，而且发展势头愈来愈强。不少人可能有这样的疑虑：国产大模型这么多，应该选择哪一个？几个月前，科大讯飞发布了星火认知大模型。作为第一批体验星火的用户，实话说效果性能还是很不错的，特别是对中文的支持。如果你还没有体验的话，可以从我这里获得体验入口！官方注册入口：作为第一批讯飞...

2024-01-22 14:29:20 1196

原创腾讯员工：能查到年终奖了，111354 元！

年关将至，互联网热议的话题，又要来到了一年一度的年终奖环节。这不，近日有鹅厂员工已经开始晒年终奖了。一看金额：111354元。属实让人羡慕~腾讯的同事们，可以尽早查询一下了，你们的年终奖数额应该已经敲定了！不得不说，腾讯的年终奖发放速度和数额令人羡慕，预计其他大型企业的员工也会开始秀出自己的年终奖。但是并非每个员工都能轻松查询到这些信息。要获得这些数据，需要公司进行报税，然后才能查看。各公司各部门...

2024-01-01 14:41:36 941

原创效率提升 100%，一款效果炸裂的白板神器！

大家好，我是红色石头！今天给大家分享一个开源的手绘图神器：excalidraw。不管是学生还是工作人员，我们在日常的工作学习中经常要记笔记，如果有一款优秀的电子白板用来绘图或者记笔记，那将会大大提高我们的工作学习效率！之前我也一直在寻找这样的白板绘图记笔记的工具，前几天逛 GitHub 的时候，就发现了一款神器：Excalidraw。试用起来就两个字：好用！一、简介Excalidraw是一款开源的...

2023-10-30 10:54:16 499

原创 GPT-4 终于开放了！

2023年，OpenAI的ChatGPT已经成为了一个不可忽视的存在。作为一种基于GPT模型的聊天机器人，ChatGPT在过去的一年多时间里里取得了令人瞩目的进步。从最初的简单问答，到现在能够进行深度对话，甚至可以执行代码，ChatGPT的能力在不断扩展，其发展速度之快，超出了许多人的预期。这不仅是技术进步的体现，也预示着人工智能正在逐步改变我们的生活。7 月 7 日，OpenAI 针对 Chat...

2023-07-08 10:54:35 560

原创泰酷辣！有人把 81 个国内大模型汇总在一张图里！

在科技的世界里，一场革命正在悄然进行。这场革命的主角，就是我们今天要讲的“大模型”。这些大模型，就像一群巨人，正在各个领域中挥舞着他们的力量，引领着一场前所未有的技术变革。在国内，这场大模型的研发热潮正在如火如荼地进行。这些大模型的名字各具特色，有的高大上，有的接地气，有的历史悠久，有的寓意深远。他们的出现，让我们感觉仿佛是在观看一场“百模大战”。最近，有网友在Github上列出了81家的大模型，...

2023-06-28 11:09:42 2414

原创刚刚，吴恩达 ChatGPT 新课三连发！

你有没有想过，你可以自己构建一个AI系统，或者开发一个使用大语言模型（LLM）的应用，甚至理解并创建扩散模型？我在吴恩达的三门新课程中找到了答案，这些课程让我看到了AI的无限可能性。好消息！就在昨天，吴恩达在推特上宣布三门新的生成式AI课程上线。这三门课分别是：《使用OpenAI的ChatGPT API构建系统》《LangChain用于LLM应用开发》《扩散模型如何工作》一、ChatGPT API...

2023-06-02 10:51:56 891

原创突然放大，Midjourney 来中国了！

突然放大，Midjourney 来中国了！一、 Midjourney内测版本的推出Midjourney，一款新颖的 AI 视觉艺术平台，近日在中国开放了内测版。这个内测版本在 QQ 频道上进行，每周一和周五的 18:00 开放入口，人数一旦满足，入口就会关闭，直到下次开放。用户只需扫描二维码，即可进入进行体验。二、功能丰富，用户体验升级内测版功能丰富，虽然部分功能只对会员开放，但大部分功能对所有...

2023-05-17 10:51:11 1058

原创桌面版 ChatGPT 来了！

由于工作、学习需要，现在基本上每天都要使用几个小时的 ChatGPT。一直以来的方法就是登录 OpenAI ChatGPT 的 web 版：http://chat.openai.com/每天登录网页比较麻烦，如果能有一个桌面应用就方便了！今天就给大家推荐一个 ChatGPT 的桌面版应用：ChatGPT Desktop Application！ChatGPT Desktop Application...

2023-05-07 12:10:48 11736 5

原创一款可以让 ChatGPT 联网的神器！

我们知道，不论是 GPT-3.5 还是 GPT-4.0，他们的知识库都是截至到 2021 年 9 月的。还无法实现即时联网并获取最新的咨询信息。我之前在星球分享过的谷歌浏览器插件 ChatGPT for Google，可以在进行谷歌网页搜索的同时，获取 ChatGPT 的回答。但是 ChatGPT 依然无法联网。今天分享一个可以让 ChatGPT 联网的神器，真正做到了 Google+ChatGP...

2023-04-22 10:51:13 5968 1

原创比微信还方便，一键导出你与 ChatGPT 的聊天记录，而且是 Markdown 格式！

需求：我们知道 ChatGPT 是文本形式输出内容。在有时候与 ChatGPT 进行交谈的过程中，遇到 ChatGPT 提供的有价值的信息，我们通常想要把整个对话内容保存起来或者复制到别的地方展示。一般的方法就是将整个对话框截图，或者一段一段话复制，非常麻烦！面对这种问题，如果能够将整个 Chat 对话框所有内容保存为一种格式，以文件的形式保存下来就好了！而 Markdown 就是一种很好的文件格...

2023-04-12 10:51:54 12195

三星S3C2440中文手册

空空如也