自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Python学习与数据挖掘

微信公众号:Python学习与数据挖掘,让分享成为一种习惯!

  • 博客(13)
  • 资源 (1)
  • 收藏
  • 关注

原创 再次出发!FaceBook 开源“一站式服务“时序利器 Kats !

欢迎关注 ,专注Python、数据分析、数据挖掘、好玩工具!我相信很多人都听过或者用过 FaceBook 的 Prophet 来解决时间序列问题,前几天我分享了这样一篇文章:太棒了!FaceBook 开源全网第一个时序王器 Kats ! 受到了很多人的喜爱!也有部分朋友私信我,对于 Kats 还有很多没有理解透彻的地方。今天我们再次出发,通过通俗易懂的方式,让大家更好理解 Kats ,喜欢此文点赞支持,欢迎收藏学习。我们知道时间序列分析是数据科学中一个非常重要的领域,它主要包含统计分析、检测变化点.

2021-07-25 17:18:41 688

原创 超硬核!分享9个功能强大却鲜为人知的 Python 工具包!

欢迎关注 ,专注Python、数据分析、数据挖掘、好玩工具!我们知道 Python 编程简单明了,并且有很多很酷的库和函数,它可以使我们的工作变得更简单。在本文中,我将分享9个鲜为人知但你可能会非常感兴趣的 Python 库,其中一些库甚至可以用作某些标准 Python 库的替代品,它们绝对是值得学习的工具包!欢迎收藏学习,梳理不易,点赞支持。让我们开始学习吧!1、PendulumPendulum 是一个很棒的Python库,可以处理日期和时间。这个库在涉及时区的情况下非常有用。该库最好的部分.

2021-07-24 18:48:03 1611 12

原创 太棒了!FaceBook 开源全网第一个时序王器 Kats !

欢迎关注 Python学习与数据挖掘,专注Python、数据分析、数据挖掘、好玩工具!时间序列分析建模是数据科学和机器学习的一个重要的领域,在电子商务、金融、供应链管理、医学、气象、能源、天文等诸多领域有着广泛的应用。目前时间序列分析以及建模的技术非常多,但相对散乱,本次 FaceBook 开源了 Kats,它是一款轻量级的、易于使用的、通用的时间序列分析框架,包括:预测、异常检测、多元分析和特征提取嵌入。Kats 是第一个开发标准并连接时间序列分析各个领域的综合 Python 库,用户可以在这里探.

2021-07-22 08:43:27 1585 15

原创 太枯燥?分享一个交互式动画可视化 Python 工具包!

欢迎关注 ,专注Python、数据分析、数据挖掘、好玩工具!数据可视化有助于理解不同的模式、从数据中获得的直观见解,这一点很重要,因为它以图表、图形和绘图的形式揭示数据背后的奥秘。有很多个 python 库可以帮助可视化数据,如 Matplotlib、Seaborn 等。如果我们可以把图片动态化,是不是很有意思!AnimatPlot 是一个开源的 python 库,它构建在 Matplotlib 之上,用于创建高度交互式的动画绘图。在本文中,我们将探讨 AnimatPlot 提供的一些功能。我们.

2021-07-11 11:29:20 1312 16

原创 停止以 CSV 格式保存数据帧,这些格式更棒!

欢迎关注 ,专注Python、数据分析、数据挖掘、好玩工具!数据科学就是要处理数据。整个数据科学模型开发流程涉及数据讨论、数据探索、探索性数据分析、特征工程和建模。读取和保存中间文件是模型开发中的一项常见任务。数据科学家通常更喜欢以 CSV 格式读取和保存 Pandas 数据帧。处理小尺寸或中等尺寸的数据非常简单,不需要太多开销,但是当处理大尺寸的数据集时,由于资源的限制,工作流会变慢。CSV、Excel或其他文本文件格式在处理大数据时会失去吸引力。有各种二进制数据格式优于 CSV 文件格式,Pa.

2021-07-10 10:58:14 310

原创 每个 Python 开发者必备的5款 VScode 拓展工具包!

欢迎关注 ,专注Python、数据分析、数据挖掘、好玩工具!VScode 是由 Microsoft 为Windows、Linux 和 macOS 开发的一款源代码编辑器。它包括调试、语法突出显示、智能代码完成、代码片段、代码重构和嵌入式Git等功能。读过我的文章的小伙伴应该会记得,之前我已分享过 VScode 的文章,收到了上千个赞、6000+的收藏,能够感受到大家对 VScode 的喜爱,链接分享如下:基础版:超强大!没有这 24 款插件的 VScode 是没有灵魂的!工具版:爱了爱了!8 .

2021-07-10 08:06:47 1744 12

原创 省时提效!5个必知必会的 SQL 窗口函数!

SQL 是数据世界中的通用语言,是作为数据科学人员必备技能。它之所以如此重要,是因为许多数据探索、数据操作、管道开发和仪表板创建都是通过 SQL 完成的。想要利用 SQL 高效处理数据任务,掌握一些窗口函数非常有必要。那我们就开始吧!1、带 LEAD() 和 LAG() 的增量LEAD() 和 LAG() 主要用于比较给定度量的一个时间段和前一个时间段。举几个例子:你可以得到每年销售额和上一年销售额之间的差值;你可以得到每月注册/转换/网站访问量的增量;你可以每月比较一次用户流失率;以如

2021-07-08 15:19:33 371 1

原创 真棒!5 个 Python 技巧让我的数据科学工作更轻松!

数据科学的主要工作就是分析数据,从数据中挖掘潜在业务价值,在本文中,我将给大家分享在工作中学到的5个技巧,这些技巧对我提高工作效率很有帮助。希望这些能对你的旅程有所帮助。我们开始吧!1、基于Pandas的时间序列数据处理如果你使用时间序列数据,很可能花费大量时间来处理丢失的记录,可以通过编写自定义函数以特定的时间粒度聚合数据。Pandas 有一个非常有效的 resample 函数,它可以帮助我们以特定的频率处理数据,只需将 DataFrame 索引设置为 timestamp 列。我将使用"占用检测数

2021-07-07 22:58:40 298

原创 只需几行代码,Python 执行速度就可以提高了30倍!

Python 是一种流行的编程语言,也是数据科学界最受欢迎的语言。由于 Python 的动态性和多功能性,与其他流行编程语言相比,Python 的速度主要较慢,C语言的执行比 Python 代码快10到100倍。在本文中,我们将讨论如何多模块并行执行自定义Python函数,并进行性能比较。Multiprocessing数据探索、数据分析和特征工程是数据科学模型开发的重要元素。在将原始数据输入机器学习模型之前,需要对其进行设计和处理。对于小尺寸的数据集,执行过程在几秒钟内完成,但是对于大尺寸的数据集,执

2021-07-06 16:13:54 1141 17

原创 真棒!这8个 Python 小技巧派上用场了!

Python 可以说是数据科学生态系统中最流行的编程语言。受欢迎的原因之一是为数据科学选择了丰富的数据处理方法。在本文中,我将分享8个非常棒的方法、函数,它们在你的日常工作中派上用场。我们开始吧!1、hasnans有许多方法可以检查 Series/DataFrame 是否包含缺少的值,包括 missingno 之类的专用库。检查 DataFrame 的列是否包含缺少的值的简单方法如下所示:df["column"].isna().any()或者,我们可以使用 pd.Series 的 hasnan

2021-07-06 00:59:04 714 13

原创 增强 Python 代码的可读性,pycodestyle 利器来了!

编程是数据科学中不可或缺的技能,虽然创建脚本来执行基本功能很容易,但编写大规模可读性良好的代码需要更多的思考。鉴于 Python 在数据科学中的流行,我将深入研究 pycodestyle 的使用方法,以提高 Python 代码的质量和可读性。如果你想提升代码质量,欢迎收藏学习,有所收获,点赞支持!目录关于PEP-8目的安装基本用法高级用法关于PEP-8pycodestyle 检查器提供基于 PEP-8 样式约定的代码建议。那么 PEP-8 到底是什么呢?PEP 代表 Python 增

2021-07-04 23:52:23 781 5

原创 效率倍增!这4个F-strings 的 Python 小技巧太棒了!

字符串插值是一种将变量嵌入字符串的方法。它使操作和丰富字符串变得容易。因此,使用字符串插值,print 语句的功能要强大得多。格式化字符串文字,也称为 f-strings,是一种非常实用的字符串插值方法。它们使用大括号作为变量占位符。在本文中,我们将介绍4个技巧来更有效地使用 f-strings。让我们从一个简单的例子开始来演示 f-strings 是如何工作的。age = 24print(f"John is {age} years old.")John is 24 years old.1、格

2021-07-01 10:44:42 302

原创 机器学习模型可解释性的6种Python工具包,总有一款适合你!

开发一个机器学习模型是任何数据科学家都期待的事情。我遇到过许多数据科学研究,只关注建模方面和评估,而没有解释。然而,许多人还没有意识到机器学习可解释性在业务过程中的重要性。以我的经验,商业人士希望知道模型是如何工作的,而不是度量评估本身。这就是为什么在这篇文章中,我想向大家介绍我的一些顶级机器学习可解释性 Python 工具包。我们开始吧!1、YellowbrickYellowbrick 是一个开源的 Python 包,它通过可视化分析和诊断工具扩展了 scikit-learn API。对数据科学

2021-07-01 08:43:46 1998 6

mac版SimHei(黑体)

最近想使用matplotlib画图,发现plot出来的图无法显示中文,都是如下图的小方格,查找了很多资料,基本都是这样处理,其实这样处理基本上都是无用的(mac版本的),解决方案我在下面给出,如果你遇到相似的问题,请继续阅读。

2020-07-04

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除