数据科学已死?

既然有了人工智能,训练自己的机器学习模型是否还值得?

既然有了人工智能,学习 Python 是否还值得?

既然有了人工智能,KNIME 还在营业吗?

既然有了人工智能,数据科学是否仍然需要?或者我们应该宣布它已死?

既然有了人工智能,我们还需要数据科学家吗?

在这一长串问题中,我还要加上我的个人疑问:既然有了人工智能,我们还需要平面设计师吗?

这些都是非常好的问题,虽然有点夸张。

NSDT工具推荐: Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割 

1、生成式AI已经成长起来

你可以要求 Gen AI 生成某某图像,它会生成。你可能不喜欢它,你可以对其进行改进,但它会生成。或者你可以要求 Gen AI 围绕主题 X 写一首诗,它会生成。专业诗人可能不喜欢它,但它足以在朋友之间的餐桌上进行诗歌比赛。你还可以要求给圣诞老人写一封信,或者写一封关于产品 Y 不起作用的投诉信。在这两种情况下,都会如此。

图 1. KNIME 工作流使用 LLM 和 AI 节点创建对话代理并与其交互

所以,是的。Gen AI 可以生成文字或图像,非常适合日常任务。但是,它足够专业吗?它能写出一整本有意义的书或一部电影的情节吗?也许,如果你只是确切地说明要写什么,如何旋转它,但对于真正的专业工作来说,它可能还不够好。不过,它可能只适合世俗。

2、AI 可以编写 Python 代码

AI 可以几乎完美地编写 Python 代码。这不是很棒吗?编码时间减少,我们有更多的时间考虑要实现什么。

你读过 Dennis Ganzaroli 关于 1812 年拿破仑在俄罗斯战役的 Minard 图表的帖子吗?好吧,他有数据,他决定通过 KNIME Analytics Platform 提供的 Python 节点用 Python 对其进行可视化。

自 5.1 版以来,KNIME Analytics Platform 在其框架中集成了一些 Gen AI 功能,也称为 KNIME AI 或简称 K-AI。特别是,所有 Python 节点都在配置对话框中提供了一个 K-AI 聊天机器人,工作流构建者可以在其中寻求有关如何编写所需的特定 Python 代码的建议。

Dennis 基本上是在和 K-AI 闲聊,要求编写 Python 代码来可视化 Minard 的数据。虽然第一次尝试并不令人满意,但他不断完善它,并提出了 K-AI 接受并包含在草稿代码中的进一步建议。在不影响 Dennis 编写 Python 代码能力的情况下,这里 K-AI(KNIME 的人工智能代理)完成了所有工作。

注意。请记住,K-AI 是 KNIME 扩展,必须在安装 KNIME Analytics Platform Core 后单独安装。还请记住,要查询 K-AI,你需要使用 KNIME Community Hub 上的免费帐户登录。

3、AI 可以创建 KNIME 工作流程

K-AI 还可以创建 KNIME 工作流程。

图 3. K-AI 在 KNIME Analytics Platform 中的运行情况。请注意顶部的“问答”和“构建”模式

自 5.1 版以来,KNIME Analytics Platform 已在其框架(称为 K-AI)中集成了一些 Gen AI 功能,以帮助用户构建工作流。如果安装了 K-AI 扩展,KNIME Analytics Platform 工作台左上角的第四个选项卡将引导至 K-AI 聊天区。在这里,用户可以与 K-AI 聊天以获取建议(“问答”选项)或构建工作流(“构建”选项)。Vittorio Haardt 的这篇文章教您什么是 LLM,以及 K-AI 如何帮助您节省组装工作流的时间。

K-AI 在构建 KNIME 工作流方面不如编写 Python 代码那么专业,但其工作流构建技能正在一个又一个版本中快速提高。

4、数据科学家还能做什么?

所有这些新的 AI 功能听起来有点让人不知所措,让我们想知道我们还能做些什么。尤其是作为数据科学家、模型训练师、Python 程序员、KNIME 工作流构建者,我们还能做什么呢?

首先,AI 不会自己构建东西,不会训练模型,不会编写 Python 脚本,不会构建 KNIME 工作流,只是因为。需要有人告诉它如何构建以及如何构建。在 Dennis Ganzaroli 的文章中,作者必须给出任务,然后不断完善,直到结果符合他的预期。即使在使用 AI 作为支持时,项目所有者仍然需要在后续步骤中描述整个过程:构建什么、如何构建、从哪些数据构建等等。

其次,AI 不会检查正确性。AI 提供结果。评估这是否正确不是其任务的一部分。AI 仍然需要由专家用户检查正确性:检查数据科学的正确性和业务健全性。为此,我们需要一个熟练的最终用户,他知道必须实现什么以及如何实现。

如果结果不正确或与提示的任务不符,最终用户需要通过更好的提示对其进行改进,或者手动添加缺失的部分。这直接引出了第三点:AI 模型的微调。现在出现了微调 AI 模型的趋势。为此,你肯定需要数据科学家。

继续 AI 生成的图像和图形设计师的平行,AI 可以生成各种图像。但是,只有最后的图形设计师才能验证图像质量并在需要时帮助改进。最近,我看到了太多丑陋的图像,当人们告诉我它们是 AI 生成的时,它们并没有得到改善。能够使用 AI 生成图像并不意味着你就是图形设计师。能够纠正和改进它们才是。

5、我们还需要数据科学家吗?

综上所述,我们将不再需要纯粹的实施者。尤其是对于基本任务,人工智能将变得越来越好,将使纯粹的实施者变得不那么必要。然而,我们仍然需要了解数据科学过程及其数学要求、知道如何纠正和重新定向人工智能工作以及如何解释人工智能生成结果的专业人士。在实践中,我们正在从创建和训练模型和服务转向使用和改进它们。

长话短说,我们仍然需要数据科学家。不过,这个角色在未来可能会发生变化。它将更多地关注算法和数据科学过程,而不是编程。同时,低代码工具将使整个过程的实施更加平易近人、速度更快。我们将需要更多的通用数据科学家,他们精通算法的数学,善于沟通,并善于引导和纠正人工智能以实现预期结果。

6、数据科学死了吗?

数据科学可能没有死,但它肯定在发生变化。最好的数据科学家不是能够更快地编写代码的人,而是能够更好地指导数据科学项目的组装的人,同时考虑到数据集成、数据质量、数据历史、机器学习算法、结果解释和过程的正确性。

我们会变得更加通才吗?可能,在数据科学项目的初始阶段,我们需要更多的通才来更多地参与这个过程。然而,我们仍然需要专家数据科学家来审查和纠正人工智能的输出。就像平面设计师一样,数据科学家将利用人工智能更快地实施解决方案,但仍需要对人工智能提供的解决方案的质量保持警惕。


原文链接:数据科学已死? - BimAnt

  • 16
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 很抱歉,我无法回答这个问题。但是,我可以提供一些建议,比如检查您的anaconda环境中是否有正确的tensorflow安装,以及您的系统是否支持tensorflow运行。此外,您还可以尝试升级内核,以确保您的系统具有最新的稳定版本。 ### 回答2: Anaconda将Python及其相关的科学计算包(包括TensorFlow)打包在一起,方便用户进行数据分析和机器学习。当安装和使用Anaconda时,有时会出现Anaconda运行TensorFlow时内核死亡的情况。 造成内核死亡的原因可能有多种可能性。首先,Anaconda是一个较为复杂的软件包,其中有许多依赖关系。如果这些依赖关系之间存在冲突,可能导致TensorFlow无法正常运行,进而导致内核死亡。 其次,Anaconda的配置和运行环境也可能对TensorFlow的运行产生影响。例如,系统的硬件配置、操作系统版本以及Anaconda和TensorFlow的版本等,都可能对运行结果产生影响。如果配置不正确或不兼容,可能导致TensorFlow无法正常运行,从而导致内核死亡。 此外,从软件层面来看,如果Anaconda或TensorFlow本身存在bug或者代码错误,也有可能导致内核死亡的情况。 针对内核死亡的问题,可以尝试以下解决方法: 1. 确保Anaconda及其相关的库和依赖已经按照正确的版本安装,并且与操作系统兼容。 2. 检查Anaconda和TensorFlow的版本,根据官方文档要求选择合适的版本。 3. 更新Anaconda和TensorFlow的版本,以确保使用最新的修复bug的版本。 4. 检查系统的硬件配置,确保满足TensorFlow的系统要求。 5. 在使用Anaconda运行TensorFlow时,尝试使用其他的Python IDE(如Jupyter Notebook)来替代内置的Anaconda环境,看是否可以避免内核死亡的问题。 总之,Anaconda运行TensorFlow时内核死亡可能由多种原因引起,需要仔细检查配置、版本和依赖关系等因素,以尽可能地解决这个问题。 ### 回答3: Anaconda是一个用于数据科学和机器学习的Python发行版,而TensorFlow是一个流行的机器学习框架。当在Anaconda环境中运行TensorFlow时,可能会遇到内核死亡的问题。其中可能的原因如下: 1. 版本不兼容:Anaconda环境中安装的TensorFlow版本可能与系统或其他库存在不兼容的情况,导致内核崩溃。在使用Anaconda时,确保TensorFlow与其他库和依赖项的版本兼容性。 2. 资源不足:TensorFlow在运行时需要大量的计算资源,如CPU和内存。如果Anaconda环境中的资源不足,可能会导致内核死亡。可以尝试分配更多的资源给Anaconda环境或减少运行TensorFlow时的资源消耗。 3. 异常错误:在代码中可能存在语法错误、逻辑错误或其他异常,这可能导致内核死亡。检查代码中的错误并修复它们,可以避免内核崩溃。 4. 安装问题:Anaconda环境中安装TensorFlow时可能出现问题,可能是由于网络连接的问题或软件安装过程中的错误。重新安装TensorFlow或检查安装过程中的错误可以解决此问题。 在遇到内核死亡的问题时,可以尝试重新启动内核或重启Anaconda环境,并参考上述解决方法来诊断和解决问题。同时,可以查看Anaconda和TensorFlow的官方文档和社区支持,以获取更多关于此问题的帮助。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值