去哪里找sklearn的源码

我使用的python版本:python3.7.5 环境:pycharm

学习sklearn时想要看看决策树部分的源码,结果发现找不到包含源代码的.pyx文件。

在sklearn中,底层代码是由cpython编写的。cpython生成的文件格式主要有三种:.pxd .pyd .pyx

  • .pxd 文件是由 Cython 编程语言 “编写” 而成的 Python 扩展模块头文件,其中有 Cython 模块要包含的 Cython 声明 (或代码段),还可为 .pyx 文件模块提供 Cython 接口。
  • .pyx 文件是由 Cython 编程语言 “编写” 而成的 Python 扩展模块源代码文件,其中有 Cython 模块的源代码。不像 Python 语言可直接解释使用的 .py 文件,.pyx 文件必须先被编译成 .c 文件,再编译成 .pyd (Windows 平台) 或 .so (Linux平台) 文件,才可作为模块 import 导入使用。
  • .pyd 文件是非 Python,由其它编程语言 “编写-编译” 生成的 Python 扩展模块, Python 要导入 .pyd 文件,实际上是在 .pyd 文件中封装了一个 module。

以下是我遇到问题和解决问题的过程:

在项目中找到了venv/Lib/site-packages/sklearn/tree 文件夹,如图:
tree

可见,这里只有.pxd文件和.pyd文件,没有源代码文件.pyx。
查看_tree.pxd文件,可见决策树中一些结构的声明,但具体编写实现的代码应在_tree.pyx文件中。
_tree.pxd内部
那么_tree.pxd文件在哪呢。
我在python的安装目录下,项目的目录下都没有找到。

问题的解决

最终我在github上sklearn的官方开源项目里找到了完整的源代码。
gihub
分析得,我们在导入sklearn库时,直接导入了编译转换好的,能为python所使用的.pyd文件,而不是cpython所写成的源代码.pyx。

  • 5
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Sklearn是一个流行的Python机器学习库,它提供了各种机器学习算法和工具,以帮助开发者构建和部署机器学习模型。如果你想深入了解Sklearn的源代码,下面是一些可能有助于你理解它的步骤和资源: 1. 官方文档:首先,我建议你查阅Sklearn的官方文档。官方文档中详细介绍了每个模块、每个函数以及它们的参数和用法。你可以通过阅读文档来了解Sklearn的工作原理和设计思路。 2. GitHub仓库:Sklearn的源代码托管在GitHub上,你可以访问https://github.com/scikit-learn/scikit-learn 来查看源代码。你可以浏览不同的模块和子模块,了解它们是如何实现的,并且参考相关的注释和文档字符串。 3. 源码结构:Sklearn的源代码结构非常清晰,不同的算法和功能被组织在不同的模块中。你可以从顶层的sklearn目录开始,逐步深入到具体的模块和类。阅读源码时,要注意查看各个类的继承关系和方法的调用关系,这有助于你理解整个库的结构和运行流程。 4. 调试和打印:如果你想更深入地了解Sklearn的内部运行机制,你可以使用调试工具来跟踪代码的执行过程。另外,你还可以在关键的位置插入打印语句,输出一些变量的值,以便观察代码的执行情况。 5. 论文和博客:Sklearn的源代码通常是基于机器学习算法的论文和研究成果实现的。如果你对某个具体的算法感兴趣,你可以查阅该算法的相关论文和博客文章,了解其原理和实现细节。这有助于你更好地理解Sklearn中相应模块的代码。 总之,阅读Sklearn源代码是一个深入理解机器学习库实现细节的好方法。通过仔细阅读文档、查看源码、调试代码以及参考相关论文,你可以更好地了解Sklearn的工作原理和设计思想。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值