卸下技术债务!数据科学家需要简洁的Python代码

全文共6616字,预计学习时长19分钟

来源:Pexels

 

数据科学团队倾向于向两个互相竞争的领域发展。

 

一方面,有一些数据工程师非常看重高度可靠,稳固的代码,这些代码承担的技术债务少。另一方面,有些数据科学家非常重视概念验证(e.g.设置)中想法和算法的快速原型设计。

 

虽然更成熟的数据科学功能使双方之间拥有卓有成效的工作伙伴关系,建立了完善的CI / CD管道,并明确定义了职责分工,但早期团队通常由经验不足的数据科学家主导。所以,代码质量受到损害,技术债务以胶合代码,流水线丛林,无效的实验代码路径和配置债务的形式呈指数级累积[1]。

你能想象没有xkcd的生活吗?

 

最近,我写了一篇关于为什么数据科学家的代码倾向于遭受平庸之苦的评论文章,在这篇文章中,我希望介绍一些方法供新手数据科学家编写更清晰的Python代码并更好地构建小型项目,以及阐明减少技术债务在不经意间给你和所在团队带来的负作用。

 

下面的内容既不详尽也不足够严谨,旨在以浅显的方式介绍深层次建立数据科学项目的方式。有些要点很明显,有些则有点隐晦。

 

以下是本文内容的快速概述:(1)样式准则,(2)文档,(3)类型检查,(4)项目文件夹结构,(5)代码版本控制,(6)模型版本控制,(7)环境,(8)Jupyter笔记本,(9)单元测试,(10)记录。

 

Python 代码样式指引——PEP 8和linting

 

可读性非常重要,PEP8就是为此而打造,提供了编写简洁python代码的惯例。

 

符合PEP8规范是Pythonic代码的最基本要求。它表明你已经了解了Python开发人员的最基本预期。表明你能够与其他开发人员更轻松地协同合作,最重要的是,你的代码将更具可读性和一致性,并且更加方便自己理解。

 

在这里复制和重新格式化PEP8样式指南属于无用功。因此,你可以根据自己的喜好浏览pep8.org,查看示例并了解在微观层面(与在宏观层面或系统级别上编写简洁代码相反)上编写简洁代码的意义。

 

PEP8中提供的示例包括设置命名约定,缩进,导入和行长的标准。

 

顺便说一句, PEP8是应使用成熟的IDE(如看来像高级Python IDE的PyCharm)而非Sublime这样的简单文本编辑器来编写代码的原因之一。适用于Python的重量级IDE通常会遵循PEP8样式指南,它会在违反PEP8原则或自动重新格式化代码库时发出警告。

 

以下是四个(尽管实际上还有许多种)命令行工具,通过对源代码执行静态分析,以保持其简洁和一致性:

 

1. PyLint-最受欢迎的linter。它能够检查源代码,并充当错误和质量检查器。它比PEP8具有更多的验证检查和选项。但是,根据默认设置,它的输出有点过于繁琐,输出量偏大。

2. Black-自动重新格式化Python代码。 Black将重新格式化整个文件的格式,并格式化字符串以使其添上双引号。

3.

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
【1】项目代码完整且功能都验证ok,确保稳定可靠运行后才上传。欢迎下载使用!在使用过程中,如有问题或建议,请及时私信沟通,帮助解答。 【2】项目主要针对各个计算机相关专业,包括计科、信息安全、数据科学与大数据技术、人工智能、通信、物联网等领域的在校学生、专业教师或企业员工使用。 【3】项目具有较高的学习借鉴价值,不仅适用于小白学习入门进阶。也可作为毕设项目、课程设计、大作业、初期项目立项演示等。 【4】如果基础还行,或热爱钻研,可基于此项目进行二次开发,DIY其他不同功能,欢迎交流学习。 【注意】 项目下载解压后,项目名字和项目路径不要用中文,否则可能会出现解析不了的错误,建议解压重命名为英文名字后再运行!有问题私信沟通,祝顺利! 基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip基于C语言实现智能决策的人机跳棋对战系统源码+报告+详细说明.zip
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值