卸下技术债务！数据科学家需要简洁的Python代码

最新推荐文章于 2022-05-14 17:32:34 发布

「已注销」

最新推荐文章于 2022-05-14 17:32:34 发布

阅读量772

点赞数

分类专栏：热点文章 AI 文章标签： pandas

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/duxinshuxiaobian/article/details/103793359

版权

全文共6616字，预计学习时长19分钟

来源：Pexels

数据科学团队倾向于向两个互相竞争的领域发展。

一方面，有一些数据工程师非常看重高度可靠，稳固的代码，这些代码承担的技术债务少。另一方面，有些数据科学家非常重视概念验证（e.g.设置）中想法和算法的快速原型设计。

虽然更成熟的数据科学功能使双方之间拥有卓有成效的工作伙伴关系，建立了完善的CI / CD管道，并明确定义了职责分工，但早期团队通常由经验不足的数据科学家主导。所以，代码质量受到损害，技术债务以胶合代码，流水线丛林，无效的实验代码路径和配置债务的形式呈指数级累积[1]。

你能想象没有xkcd的生活吗?

最近，我写了一篇关于为什么数据科学家的代码倾向于遭受平庸之苦的评论文章，在这篇文章中，我希望介绍一些方法供新手数据科学家编写更清晰的Python代码并更好地构建小型项目，以及阐明减少技术债务在不经意间给你和所在团队带来的负作用。

下面的内容既不详尽也不足够严谨，旨在以浅显的方式介绍深层次建立数据科学项目的方式。有些要点很明显，有些则有点隐晦。

以下是本文内容的快速概述：（1）样式准则，（2）文档，（3）类型检查，（4）项目文件夹结构，（5）代码版本控制，（6）模型版本控制，（7）环境，（8）Jupyter笔记本，（9）单元测试，（10）记录。

Python 代码样式指引——PEP 8和linting

可读性非常重要，PEP8就是为此而打造，提供了编写简洁python代码的惯例。

符合PEP8规范是Pythonic代码的最基本要求。它表明你已经了解了Python开发人员的最基本预期。表明你能够与其他开发人员更轻松地协同合作，最重要的是，你的代码将更具可读性和一致性，并且更加方便自己理解。

在这里复制和重新格式化PEP8样式指南属于无用功。因此，你可以根据自己的喜好浏览pep8.org，查看示例并了解在微观层面（与在宏观层面或系统级别上编写简洁代码相反）上编写简洁代码的意义。

PEP8中提供的示例包括设置命名约定，缩进，导入和行长的标准。

顺便说一句， PEP8是应使用成熟的IDE（如看来像高级Python IDE的PyCharm）而非Sublime这样的简单文本编辑器来编写代码的原因之一。适用于Python的重量级IDE通常会遵循PEP8样式指南，它会在违反PEP8原则或自动重新格式化代码库时发出警告。

以下是四个（尽管实际上还有许多种）命令行工具，通过对源代码执行静态分析，以保持其简洁和一致性：

1. PyLint-最受欢迎的linter。它能够检查源代码，并充当错误和质量检查器。它比PEP8具有更多的验证检查和选项。但是，根据默认设置，它的输出有点过于繁琐，输出量偏大。

2. Black-自动重新格式化Python代码。 Black将重新格式化整个文件的格式，并格式化字符串以使其添上双引号。

3.

最低0.47元/天解锁文章

「已注销」

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
卸下技术债务！数据科学家需要简洁的Python代码

全文共6616字，预计学习时长19分钟来源：Pexels数据科学团队倾向于向两个互相竞争的领域发展。一方面，有一些数据工程师非常看重高度可靠，稳固的代码，这些代码承担的技术债务少。另一方面，有些数据科学家非常重视概念验证（e.g.设置）中想法和算法的快速原型设计。虽然更成熟的数据科学功能使双方之间拥有卓有成效的工作伙伴关系，建立了完善的CI / CD管道，...
复制链接

扫一扫

专栏目录

「已注销」

博客等级

码龄5年

2070
原创

4456
点赞

1万+
收藏

4917
粉丝

关注

私信

热门文章

分类专栏

热点文章 552篇
AI 1079篇
热点文章 559篇
干货文章 39篇
热门文章 1篇
学术报告 11篇
干货文章 69篇
学术报告

最新评论

提前返回有好处吗？
温庭筠: 我不使用提前返回, 因为接手别人的代码时确实比较难理解一旦代码达到了维护阶段，新手程序员试图推理逻辑时，多次返回就会大大影响他们的效率（当注释比较分散，代码模糊不清时尤其糟糕）
在Windows系统和Linux系统中，如何打造一个好终端？
全栈小5: 文章结构严谨，每次阅读都能收获知识，感谢博主的分享，期待博主继续更新高质量文章，支持！【如何让windows终端和linux一样好用，博主这篇文章，值得一看】
NLP入门第一步：6种独特的数据标记方式
麦甜守望者: 有中文怎么标注的吗？
海量案例！生成对抗网络（GAN）的18个绝妙应用
PreWisdom: 18 Impressive Applications of Generative Adversarial Networks (GANs) by Jason Brownlee on July 12, 2019 in Generative Adversarial Networks https://machinelearningmastery.com/impressive-applications-of-generative-adversarial-networks/ 你知道我要说什么吧，你这完全是把别人的文章简单翻译了一下搬过来了，然后你发原创，真行啊
从零开始的人工智能和机器学习，该从哪里入手呢？
CSDN-Ada助手: 多亏了你这篇博客, 解决了问题: https://ask.csdn.net/questions/8023395, 请多输出高质量博客, 帮助更多的人

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。