自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

龙哥盟

掠夺·扩张·投机·博弈

  • 博客(9078)
  • 资源 (971)
  • 问答 (2)
  • 收藏
  • 关注

原创 布客沉思录(一):【历史垃圾时间】就是彻头彻尾的伪概念

所以新的方向之一必须是能从市场上直接赚到钱的,对于程序员来讲,我们没有什么时间,但我们有自动化能力,有AI能力,所以最好的方式就是量化交易。《单干》一书中提到,最好的商业方式必须离钱最近,必须变现环节最小,轻资产大于重资产,自动大于手动,这样才能降低不可控性,那么量化交易一定是最符合这个描述的了。就算当时赚不到钱,也算是技术储备,等待经济好了,就一定能发挥作用。看到了吧,这个伪概念就是个自证预言:如果你觉得现在是【历史垃圾时间】,你放弃了自己的主观能动性,啥都不做,当然啥都不出错,但是啥都做不出来。

2024-08-14 14:43:16 548

原创 【布客】已经制作完成的有声书

【超越想象的GPT医疗:第六章:延展大问题:如何让数学、编码和逻辑更可靠】【超越想象的GPT医疗:第二章:智能协作,GPT-4在医学中的超强潜力】【超越想象的GPT医疗:结语:欣赏AI的奇迹,人类智慧和无尽雄心的见证】【超越想象的GPT医疗:第一章:“达芬奇3”,与GPT-4的初次接触】【超越想象的GPT医疗:第九章:安全第一,在新的AI时代充分受益】【超越想象的GPT医疗:第三章:一个大问题:AI能“理解”吗】【超越想象的GPT医疗:引言:GPT-4医生的故事】

2024-08-10 13:16:08 425

原创 布客社区及饱和式翻译计划 Q&A

A1:如果你现在,在AIGC大爆发之后问我这个问题,我只想告诉你们,翻译是 AIGC 中一种重要的形式,输出稳定,没有幻觉,比什么扩写仿写之类的好多了。当然我也尝试过很多其他的AIGC形式,比如源码解析、课程笔记之类的,但都没有翻译方便省事。翻译一定是未来几年技术自媒体 AIGC 的主流形态。

2024-08-06 13:52:20 383 1

原创 Quant文艺复兴计划正式启动!

此时此刻恰如彼时彼刻,所以我深知,如果我不自己动手写出一批教程,中文互联网就永远没有面向新手的开放教程可用。幸好现在我们有了ChatGPT,它减轻了我的主业工作量,让我有时间投入这个方面;同时,它也大大减轻了编写教程的工作量,能让这些想法迅速实现。再者,良好的量化实现是保证回测准度和自动化的前提之一。总结paperwithbacktest上的Quant前沿论文【自动】,解析代码【自动】寻找gh上的机器学习或深度学习的Quant代码,做源码解析【自动】挑选主流量化框架,翻译文档【自动】,做源码解析【自动】

2024-04-10 22:56:08 375

原创 赚钱周报、风向标、大航海 23&24

龙哥赚钱周报 23在线阅读龙哥赚钱周报 202301-02龙哥赚钱周报 202303龙哥赚钱周报 202304龙哥赚钱周报 202305龙哥赚钱周报 202306龙哥赚钱周报 202307龙哥赚钱周报 202308龙哥赚钱周报 202309龙哥赚钱周报 202310龙哥赚钱周报 202311龙哥赚钱周报 202312龙哥风向标 23在线阅读龙哥风向标 202301龙哥风向标 202302龙哥风向标 202303龙哥风向标 202304龙哥风向标 202305龙哥

2024-04-09 12:03:53 766

原创 一些用 GPT 翻译的计算机科学/人工智能 PDF 讲义

3D成像.pdf3D成像.pdf3D成像技术.pdf3D成像技术.pdf3D点云分析.pdf3D点云分析.pdfAAAI 2019 笔记.pdfAAAI 2019 笔记.pdfCMU 10.708 概率图模型讲义.pdfCMU 10.708 概率图模型讲义.pdfCMU 15-312 编程语言基础讲义.pdfCMU 15-312 编程语言基础讲义.pdfCMU 15-411 编译器设计讲义.pdfCMU 15-411 编译器设计讲义.pdfCMU 15-819 同伦类型论讲义.

2024-02-20 22:59:55 1561

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十六)

从 2017 年 11 月到 2018 年 1 月,谷歌大脑团队在Kaggle上举办了一场语音识别挑战赛。这项挑战的目标是编写一个程序,能够正确识别一秒钟长的音频文件中 10 个单词中的一个。刚刚下定决心开始认真学习数据科学,目标是在我的职业生涯中开辟一个新的角落,我决定将此作为我的第一个严峻的 kaggle 挑战。在这篇文章中,我将谈论 ResNets,RNNs,1D 和 2D 卷积,连接主义者的时间分类等等。我们走吧!这是最后一步,我们根据卡尔曼增益的计算来更新 x 和 P。

2024-09-21 08:08:10 290

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十八)

将最先进的机器学习功能放入Docker 容器中,这样像您这样的开发人员就可以轻松地将自然语言处理、面部检测、对象识别等融入其中。到您自己的应用程序中。盒子是为规模而建的,所以当你的应用真正起飞时,只需添加更多的盒子这个项目的想法是在我开始一份新工作时产生的。数据科学入门总是一个混乱的过程,但我喜欢按照这个顺序开始:数据、代码库、工作流。深入一个数据集需要你张开双臂去寻找任何地方,任何人都在记录你可能感兴趣的东西,并找出公司具体的细微差别。它会问这样的问题:“重定向邮件存储在哪个数据库中?

2024-09-21 08:07:36 517

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十五)

在机器学习中,我们并不总是被提供一个目标来优化,我们也不总是被提供一个目标标签来对输入数据点进行分类。在人工智能领域中,没有目标或标签可供我们分类的问题被称为无监督学习问题。在无监督学习问题中,我们试图对数据中存在的潜在结构化信息进行建模。聚类是一种无监督学习问题,我们试图根据相似数据的底层结构将它们分组到群组/聚类中。K-means 算法是一种广泛使用的著名聚类算法。k 代表我们要将数据点分类到的聚类数。下表提供了关于所获得的聚类结果的结论。PCA 做的最好!

2024-09-21 08:07:03 753

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十二)

组织内的决策直接受到手头数据的影响。多年来,让业务分析师、营销人员和高管以及其他员工通过数据专家已经成为一种常态。事实上,有些人认为什么都不应该改变,而其他人认为是时候提高数据的可访问性了。在所有推动数据民主化的软件解决方案中,后者极有可能胜出。在我的上一篇帖子中,我开始了一个关于维数减少的讨论,这是在执行分类任务()之前使用主成分分析(PCA)对结果的真正影响。在这篇文章中,我将继续讨论这个主题,但现在,谈论线性判别分析(LDA)算法。

2024-09-21 08:06:28 669

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十九)

主题模型接受一个未标记文档的集合,并试图在这个集合中找到结构或主题。注意,主题模型通常假设单词的使用与主题的出现相关。例如,您可以提供一个包含一组新闻文章的主题模型,该主题模型会根据单词的用法将文档分成若干个组。主题模型是自动探索和构建大量文档的好方法:它们根据文档中出现的单词对文档进行分组或聚类。由于关于相似主题的文档倾向于使用相似的子词汇表,因此得到的文档簇可以被解释为讨论不同的“主题”。潜在狄利克雷分配(LDA)是概率主题模型的一个例子。

2024-09-21 08:05:57 535

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十三)

注意:要在上面运行,我们将使用 for…的循环,你可以阅读这里了解更多细节。这就是我们如何迭代我们的对象。代码执行五个步骤,每次运行时counter递增。首先,我们返回值1,然后是值2等等,直到5,然后我们指示已经到达迭代的末尾,并且返回值undefined。value保存实际项目和done这是一个布尔标志,指示是否已经到达终点。注意:如果需要,最后一步可以返回值,我们也可以手动中断…如果需要,使用 break 关键字。

2024-09-21 08:05:27 700

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十七)

要说内核,我们需要了解类似SVM(支持向量机)——分类监督学习机器学习-等等等等等等。这么多术语,对吗?,但不要因此而气馁(在 DIY 练习之前,我对这些一无所知)。让我们一起走进去吧那么到底什么是“机器学习(ML)”?事实证明,ML 实际上是一大堆东西,但最重要的主题可以用阿瑟·塞缪尔早在 1959 年就说过的一句话来概括:“机器学习(Machine Learning)是在没有被明确编程的情况下,赋予计算机学习能力的研究领域。一个计算机程序被说成是从经验中学习E 关于某些任务T 和某些。

2024-09-21 08:04:55 556

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十一)

在我的上一篇文章中,我们学习了如何在 ESP 设备上安装和运行 MicroPython。使用 Jupyter Notebook 作为我们的开发环境,我们还学习了如何使用多种通信协议和方法从传感器读取数据(温度、湿度和亮度),例如:模拟、数字、1 线和 I2C,后者用于在有机发光二极管显示器上显示我们捕获的数据。现在,在这篇文章中,使用 MQTT 协议,我们将获得所有捕获的数据,将它们发送到物联网服务,【ThingSpeak.com】和移动应用,Thingsview,在那里可以记录和播放它们。

2024-09-21 08:04:24 351

原创 TowardsDataScience 博客中文翻译 2016~2018(一百七十)

机器学习和数据挖掘任务中最基本的就是比较对象的能力。我们必须在聚类、分类、查询和其他方面比较(有时是平均)对象。文本也不例外,在这篇文章中,我想探索文本的不同表示/嵌入以及一些最流行的距离/相似度函数。相同的文本必须具有相同的表示和零距离(最大相似度)。当我们有多个文本 t1、t2 和 t3 时,我们希望能够说 t1 比 t3 更类似于 t2。相似度/距离应该表达文本之间的语义比较,文本长度应该影响不大。现在假设我们想把这些句子分成两组。很明显,句子 1 和句子 2 属于同一组。

2024-09-21 08:03:53 451

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十四)

由于我将探索的大多数与癌症诊断相关的工作都严重依赖于深度学习,所以我决定该系列应该从深度学习的一些基础知识的简短介绍开始。**免责声明:**我不是深度学习方面的专家,但我已经对这篇文章的准确性进行了审查。深度学习是机器学习领域中人工智能的子集。它使用大型神经网络来学习数据中哪些特征是重要的,以及如何利用这些特征来预测新数据集[123我们所说的(有监督的)学习是什么意思?输入数据,预期输出的例子(训练数据,以及一个反馈信号来表明算法执行得有多好。

2024-09-21 08:03:13 720

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十六)

NumPy 代表数字 Python。正如文档所述,NumPy 是使用 Python 进行科学计算的基础包。它用于对数组执行数值运算。NumPy 在大小、速度和功能性方面都优于 python list。关于 python list 和 NumPy 数组比较的详细描述可以在这个链接中找到。在开始使用 NumPy 之前,它需要安装在您的系统中。您可以使用 pip 或 anaconda 安装它。本文中的代码使用 Python3 和随 anaconda 安装的 NumPy。我不会对安装进行详细说明。

2024-09-21 08:02:40 734

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十八)

因为这是写给企业家的,所以我决定思考一下机会在哪里。我的印象是,光有技术和要解决的问题是不够的,还需要正确的经济激励模式,这里有大量创造力的空间,这是我试图说明的。Frieze 是一家国际艺术商业特许经营公司,1991 年以杂志起家,但后来发展成为一家组织一些年度日历上最重要的艺术博览会和活动的机构。自 2003 年以来,每年 10 月,Frieze 都会在伦敦摄政公园的中央组织一次大型当代艺术展,吸引成千上万的人。来自 20 多个国家的 150 多家画廊通常会参加盈利性艺术博览会。

2024-09-21 08:02:08 269

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十五)

自动编码器是由编码器和解码器组成的神经网络。目标是用编码器压缩您的输入数据,然后用解码器解压缩编码的数据,以便输出是您的原始输入数据的良好/完美的重建。有多少次你开车在停车场转来转去寻找停车位。如果你的手机能告诉你最近的停车位在哪里,那该有多方便啊!事实证明,这是一个使用深度学习和 OpenCV 相对容易解决的问题。只需要一张停车场的航拍照片。请看下面的 GIF,我的模型突出显示了洛杉矶机场停车场所有可用的停车位,并显示了可用停车位的数量。最棒的是,这一切可以实时工作!你可以找到我在我的上使用的代码。

2024-09-21 08:01:33 710

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十二)

这个程序的第一部分已经涵盖了很多内容。对于每个“章节”,都有一个 2 小时的视频、附带的 Jupyter 笔记本、笔记/维基(主要由学生编写/更新)、Jeremy 建议的阅读材料(博客、论文等)、作业(没有标记,但建议练习)以及现场和在线学生令人惊叹的活跃论坛。教学风格是“自上而下”的方法,你可以在这里阅读更多关于的内容。个人觉得很棒!同样,我不需要知道汇编/机器码来编写 Python,我也不需要知道每个数学公式的复杂性来利用深度学习技术。

2024-09-21 08:00:59 440

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十九)

术语人工神经网络用于指代数学模型或模拟大脑神经网络中基本计算特征的实际程序。与 TensorFlow 合作服务我想,如果也能为 Keras 模特服务,那就太棒了。Keras的优势是显而易见的——它大大简化了模型开发,并允许比纯 TensorFlow 框架更快地尝试模型。另一个动机是,我想让客户端独立于庞大的 TensorFlow 框架,并使用非常有限的一部分服务功能。当然,我想直观地显示结果,而不需要通过枯燥的 JSON 输出:-)在过去的一年半时间里,TensorFlow无论是在采用率还是在。

2024-09-21 08:00:22 464

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十三)

在探索了一段时间 CNN 之后,我决定尝试计算机视觉的另一个重要领域,物体检测。这方面有几种流行的方法,包括更快的 R-CNN、RetinaNet、YOLOv3、SSD 等。我在这篇文章中尝试了更快的 R-CNN。在这里,我想总结一下我所学到的东西,如果你对这个话题感兴趣,也许会给你一点启发。我用的较快 R-CNN 的 Keras 版本的原代码是由yhenon(资源链接:GitHub编写的。)他使用了 PASCAL VOC 2007、2012 和 MS COCO 数据集。对我来说,我只是从谷歌的。

2024-09-21 07:59:50 408

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十七)

总的来说,这是一个非常好的一天,内容非常棒(少一些技术,多一些社会/经济/政治/社会)。信噪比很好,没有任何形式的供应商推销演示(我看到的),并且受到了来自技术和商业社区各个部分的优秀、积极的观众的光顾。如果 CogX 2018 明年举行,它绝对值得参加。问候,M@ARIMA 模型有 3 个参数:P —模型的自回归特征d——差分顺序Q —模型的移动平均特征从 statsmodels.tsa.arima_model 导入 ARIMAARIMA.html。

2024-09-21 07:59:13 554

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十一)

对发生器末端的单个双曲正切单元的输入进行批量归一化将确保输入到双曲正切单元的输入具有 0 的平均值和有限的方差。这一点也不理想,因为我们希望激活在-1 和+1 之间展开。所以,不要批量归一化生成器中的最后一层。

2024-09-21 07:58:42 493

原创 TowardsDataScience 博客中文翻译 2016~2018(一百一十)

Horizon 是一个端到端平台,其中*“包括模拟环境的工作流,以及用于预处理、培训和导出生产模型的分布式平台。”*——(消息来源)从阅读文件高效处理大型数据集的能力能够自动高效地预处理数据竞争算法性能发布前的算法性能评估服务于生产的柔性模型平台可靠性这听起来对我来说太棒了,所以让我们从如何利用这个平台开始,然后我们可以更深入地了解它的工作原理。对于强化学习中用到的一些术语,可以随时查看我之前的博文了解一下。

2024-09-21 07:58:10 747

原创 TowardsDataScience 博客中文翻译 2016~2018(一百)

婚礼行业正在蓬勃发展。2016 年美国婚礼的平均费用估计在 35329 美元左右,高于 2006 年的 27852 美元(1,2)。同样,在科技领域,与婚礼相关的产品和解决方案也有越来越多的机会。这个项目旨在创建一个这样的解决方案。在传统的婚礼策划中,新娘会为所有的伴娘选择一件礼服。一种被称为“不匹配的伴娘”的新趋势背离了上述传统,并且越来越受欢迎。为了达到“不相配的伴娘”的效果,每个伴娘都有不同风格和/或颜色的礼服,它们都符合一个共同的主题。这种外观很难实现,在线工具也很少。

2024-09-21 07:57:39 443

原创 TowardsDataScience 博客中文翻译 2016~2018(一)

根据维基百科,一个架构模式是一个通用的、可重用的解决方案,用于解决给定环境下软件架构中常见的问题。架构模式类似于软件设计模式,但是范围更广。在本文中,我将简要解释以下 10 种常见的架构模式及其用法和优缺点。分层图案客户机-服务器模式主从模式管道过滤器模式经纪人模式点对点模式事件总线模式模型-视图-控制器模式黑板图案口译员模式这个挑战的目的很简单,猜猜有人在画什么。不是你,你的电脑会猜。听起来很有趣,对吧?换句话说,你的电脑是否足够智能来决定下面画的是什么?有点简单化的定义?

2024-09-21 07:57:08 663

原创 TowardsDataScience 2023 博客中文翻译(四十四)

LangChain 是一个基于语言模型开发应用程序的框架。这就是 LangChain 的官方定义。这个框架是最近创建的,已经被用作建立由 LLM 支持的工具的行业标准。它是开源的,并且在非常快的时间框架内发布新功能。官方文档可以在这里找到,GitHub 存储库可以在这里找到。我们在这个库中遇到的一个缺点是,由于这些功能是新的,我们不能有效地使用 Chat GPT 来帮助构建新的代码。这意味着我们必须以“古老”的方式阅读文档、论坛和教程来工作。

2024-09-21 07:56:37 447

原创 TowardsDataScience 2023 博客中文翻译(四十六)

在 2014 年,亚马逊发布了Lambda,将云计算的抽象推向了一个新水平,提供了无服务器计算服务。与 EC2 相比,我们对运行代码的机器没有任何信息。我们的唯一可调参数是代码允许使用的内存量。Lambda 响应事件执行代码,并自动管理底层计算资源。如果我们的代码没有在机器上主动运行,我们不会支付任何费用。这非常适合像将用户操作写入数据库或从 ML 模型生成预测这样的单次操作,但我们甚至可以构建一个基于微服务的 Web 应用或实时流数据处理器。我们在 Lambda 中的工作流程将涉及设置函数。

2024-09-21 07:56:05 513

原创 TowardsDataScience 2023 博客中文翻译(四十八)

本文为你快速概述了最重要的LightGBM超参数调优。下面你可以找到它们及其推荐调优范围的概览。最重要的LightGBM超参数及其调优范围概览(图源:作者)。当然,LightGBM还有许多其他可以使用的超参数。例如,参数指定一个叶子中的最小 Hessian 和,并且还可以帮助缓解过拟合[2]。当你的数据集不平衡时,还有一个可以调优的参数。或者你可以使用max_bin指定特征将被分桶的最大数量。在我们深入探讨训练大型语言模型(LLMs)相关的成本之前,让我们先简要定义一下什么是语言模型。

2024-09-21 07:55:23 583

原创 TowardsDataScience 2023 博客中文翻译(四十五)

根据 GitHub 提供的描述:GitHub Actions 使得自动化所有的软件工作流程变得简单,现在拥有世界级的 CI/CD。从 GitHub 直接构建、测试和部署你的代码。这意味着 GitHub Actions 是由 GitHub 提供的自动化平台,专注于自动化软件开发工作流程。Action 本身是可以作为 GitHub Actions 工作流程的一部分执行的代码单元。其目的是自动化由 GitHub 仓库中的事件触发的特定任务或工作流程。

2024-09-21 07:54:46 480

原创 TowardsDataScience 2023 博客中文翻译(四十二)

Apache Spark 目前是业内最受欢迎的大数据技术之一,由 Databricks 和 Palantir 等公司支持。数据工程师在使用 Spark 时的一个关键职责是编写高度优化的代码,以充分利用 Spark 的分布式计算能力(图 1)。图 1:Apache Spark 架构(图片由作者提供)。在本文中,你将了解在使用 Spark 时一些常见的性能问题(例如 5 Ss)以及如何解决这些问题。如果你对 Apache Spark 完全陌生,可以在我的上一篇文章中找到更多信息。API 是。

2024-09-21 07:54:16 602

原创 TowardsDataScience 2023 博客中文翻译(四十九)

强化学习(RL)是一种人工智能方法论,在这种方法中,智能体学习与其环境互动,以最大化从环境中获得的奖励信号的期望值。与监督学习不同,后者中智能体会获得标记的例子并根据输入预测输出,RL 涉及智能体主动在其环境中采取行动,并以奖励或惩罚的形式接收反馈。这些反馈用于调整智能体的行为,并随着时间的推移提高其表现。强化学习已被应用于广泛的领域,包括机器人技术、自然语言处理和金融。在游戏行业中,强化学习被用于开发高级游戏代理,例如**AlphaGo [1]**算法,该算法在围棋比赛中击败了人类冠军。

2024-09-21 07:53:44 608

原创 TowardsDataScience 2023 博客中文翻译(四十三)

原文:TowardsDataScience协议:CC BY-NC-SA 4.0人工智能驱动的安全运营架构,具有低误报率原文:towardsdatascience.com/architecture-of-ai-driven-security-operations-with-a-low-false-positive-rate-a33dbbad55b4?source=collection_archive---------1-----------------------#2023-04-21本文讨论

2024-09-21 07:53:05 447

原创 TowardsDataScience 2023 博客中文翻译(四十七)

如上所述,在批处理赌徒问题中,我们无法获得即时奖励。因此,我们需要策略性地选择行动并更新代理的策略。这引入了网格的概念,即每个批次采样多少用户,以便代理能够最佳地学习。Perchet 等人[2]在他们的论文中介绍了批处理赌徒问题并介绍了网格。为了形式化网格,我使用了 Gao 等人[3]的符号。提供的第一个网格是算术网格,这相当简单。这个网格将时间范围 T 均匀地划分为 M 个相等的批次。当 M=T 时,这等同于传统的即时奖励赌徒问题。我们使用的第二个网格是最小最大网格,其目的是最小化最大遗憾。

2024-09-21 07:52:32 233

原创 TowardsDataScience 2023 博客中文翻译(四十一)

原文:TowardsDataScience协议:CC BY-NC-SA 4.0使用 Sigma 规则进行异常检测:构建您自己的 Spark 流处理检测原文:towardsdatascience.com/anomaly-detection-using-sigma-rules-build-your-own-spark-streaming-detections-657bcef3988a?source=collection_archive---------9-----------------------

2024-09-21 07:52:00 539

原创 TowardsDataScience 2023 博客中文翻译(四十)

在下方链接的第一篇文章中,我们介绍了地理空间数据分析,下载了AirBnb在北卡罗来纳州阿什维尔市的房源数据,并进行了一些步骤以从地理空间数据中提取洞察。## 使用 Python 分析地理空间数据窗口函数的教科书定义是,窗口函数在与当前行相关的一组表行上执行计算。图片来源:Masterfile你认为这个小家伙从窗户里看到什么?是从这个房间或建筑物的窗户外景的部分视图,对吧?这正是窗口函数的作用。它允许你对数据子集进行计算,而不对当前行进行聚合。

2024-09-21 07:51:28 590

原创 TowardsDataScience 2023 博客中文翻译(四)

你可以为列聚合使用你选择的名称,以便轻松识别返回的列聚合,并去掉列标题中的第二行。你需要做的就是创建列名和聚合函数的元组,并将这个元组分配给列名。继续上述示例,你希望在列上应用函数‘min’,因此元组将是,你将把这个元组分配给名为的列,如下所示。同样,你可以为所有列聚合创建元组,并将它们分配给自定义名称。最后,将它们用逗号分隔传递给agg()函数,如下所示。在 Pandas 聚合函数中命名返回的列 | 图片来源:作者快速解决!现在,这看起来简化了很多,易于阅读。

2024-09-21 07:50:58 512

原创 TowardsDataScience 2023 博客中文翻译(十四)

原文:TowardsDataScience协议:CC BY-NC-SA 4.0初学者友好的 MLOps 介绍原文:towardsdatascience.com/a-beginner-friendly-introduction-to-mlops-95282f25325cMLOps 的第一步 Chayma Zatout· 发布于 Towards Data Science · 9 分钟阅读 · 2023 年 1 月 4 日–由 Sarah Dorweiler 拍摄于 Unsplash我

2024-09-21 07:50:27 536

原创 TowardsDataScience 2023 博客中文翻译(十六)

常数-α MC 方法是一种常数步长参数 α 的常规 MC 方法,这个常数参数有助于使价值估计对最近的经验更加敏感。在实践中,α 值的选择取决于稳定性和适应性之间的权衡。以下是 MC 方法在时间 t 更新状态值函数的方程:TD(0) 是 TD(λ) 的一个特例,它只看一步前的状态,是最简单的 TD 学习形式。该方法使用 TD 误差更新状态值函数,TD 误差是指状态的估计值与奖励加上下一个状态的估计值之间的差异。一个常数步长参数 α 与上述 MC 方法中的作用相同。

2024-09-21 07:49:57 158

AIGC系列报告202311.pdf

AIGC系列报告202311

2024-02-25

你并不了解 JavaScript(YDKJS)第二版:作用域与闭包.epub

你并不了解 JavaScript(YDKJS)第二版:作用域与闭包

2024-02-22

你并不了解 JavaScript(YDKJS)第二版:入门.epub

你并不了解 JavaScript(YDKJS)第二版:入门

2024-02-22

穿透 Laravel.epub

穿透 Laravel

2024-02-22

iceWebGL:WebGL上车指南.epub

iceWebGL:WebGL上车指南

2024-02-22

高并发的哲学原理.epub

高并发的哲学原理

2024-02-22

viml 学习手册.epub

viml 学习手册

2024-02-22

WGPU 学习手册.epub

WGPU 学习手册

2024-02-22

架构治理模式.epub

架构治理模式

2024-02-22

Rust标准库内部原理(inside-rust-std-library).epub

Rust标准库内部原理(inside-rust-std-library)

2024-02-22

Rust 宏小册.epub

Rust 宏小册

2024-02-22

深入架构原理与实践.epub

深入架构原理与实践

2024-02-22

Zig 学习手册.epub

Zig 学习手册

2024-02-22

数据工程讲义:经济学分册.epub

数据工程讲义:经济学分册

2024-02-22

Rust 中的命令行应用.epub

Rust 中的命令行应用

2024-02-22

web全栈体系.epub

web全栈体系

2024-02-22

CSS 动画 101.epub

CSS 动画 101

2024-02-22

高效 C C++ 调试(Effective Debugging).epub

高效 C C++ 调试(Effective Debugging)

2024-02-22

HuggingFace NLP 课程文档.epub

HuggingFace NLP 课程文档

2024-02-15

HuggingFace 音频课程文档.epub

HuggingFace 音频课程文档

2024-02-15

斯坦福CS229机器学习中文讲义(2022春季).pdf

斯坦福CS229机器学习中文讲义(2022春季)

2024-02-29

AIGC系列报告202310(下).pdf

AIGC系列报告202310(下)

2024-02-27

AIGC系列报告202308(下).pdf

AIGC系列报告202308(下)

2024-02-27

AIGC系列报告202310(上).pdf

AIGC系列报告202310(上)

2024-02-27

AIGC系列报告202309.pdf

AIGC系列报告202309

2024-02-27

AIGC系列报告202307.pdf

AIGC系列报告202307

2024-02-27

AIGC系列报告202306(下).pdf

AIGC系列报告202306(下)

2024-02-27

AIGC系列报告202308(上).pdf

AIGC系列报告202308(上)

2024-02-27

AIGC系列报告202305(上).pdf

AIGC系列报告202305(上)

2024-02-27

AIGC系列报告202306(上).pdf

AIGC系列报告202306(上)

2024-02-27

AIGC系列报告202305(下).pdf

AIGC系列报告202305(下)

2024-02-27

AIGC系列报告202304(上).pdf

AIGC系列报告202304(上)

2024-02-27

AIGC系列报告202304(下).pdf

AIGC系列报告202304(下)

2024-02-27

AIGC系列报告202301-02(下).pdf

AIGC系列报告202301-02(下)

2024-02-27

AIGC系列报告202301-02(上).pdf

AIGC系列报告202301-02(上)

2024-02-27

AIGC系列报告2022.pdf

AIGC系列报告2022

2024-02-27

AIGC系列报告202312(下).pdf

AIGC系列报告202312(下)

2024-02-25

AIGC系列报告202310(中).pdf

AIGC系列报告202310(中)

2024-02-25

AIGC系列报告202401(上).pdf

AIGC系列报告202401(上)

2024-02-25

AIGC系列报告202312(上).pdf

AIGC系列报告202312(上)

2024-02-25

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除