数据科学已死？

新缸中之脑

于 2024-08-21 08:34:49 发布

阅读量334

点赞数 16

文章标签：人工智能

本文链接：https://blog.csdn.net/shebao3333/article/details/141375240

版权

既然有了人工智能，训练自己的机器学习模型是否还值得？

既然有了人工智能，学习 Python 是否还值得？

既然有了人工智能，KNIME 还在营业吗？

既然有了人工智能，数据科学是否仍然需要？或者我们应该宣布它已死？

既然有了人工智能，我们还需要数据科学家吗？

在这一长串问题中，我还要加上我的个人疑问：既然有了人工智能，我们还需要平面设计师吗？

这些都是非常好的问题，虽然有点夸张。

NSDT工具推荐： Three.js AI纹理开发包 - YOLO合成数据生成器 - GLTF/GLB在线编辑 - 3D模型格式在线转换 - 可编程3D场景编辑器 - REVIT导出3D模型插件 - 3D模型语义搜索引擎 - AI模型在线查看 - Three.js虚拟轴心开发包 - 3D模型在线减面 - STL模型在线切割

1、生成式AI已经成长起来

你可以要求 Gen AI 生成某某图像，它会生成。你可能不喜欢它，你可以对其进行改进，但它会生成。或者你可以要求 Gen AI 围绕主题 X 写一首诗，它会生成。专业诗人可能不喜欢它，但它足以在朋友之间的餐桌上进行诗歌比赛。你还可以要求给圣诞老人写一封信，或者写一封关于产品 Y 不起作用的投诉信。在这两种情况下，都会如此。

图 1. KNIME 工作流使用 LLM 和 AI 节点创建对话代理并与其交互

所以，是的。Gen AI 可以生成文字或图像，非常适合日常任务。但是，它足够专业吗？它能写出一整本有意义的书或一部电影的情节吗？也许，如果你只是确切地说明要写什么，如何旋转它，但对于真正的专业工作来说，它可能还不够好。不过，它可能只适合世俗。

2、AI 可以编写 Python 代码

AI 可以几乎完美地编写 Python 代码。这不是很棒吗？编码时间减少，我们有更多的时间考虑要实现什么。

你读过 Dennis Ganzaroli 关于 1812 年拿破仑在俄罗斯战役的 Minard 图表的帖子吗？好吧，他有数据，他决定通过 KNIME Analytics Platform 提供的 Python 节点用 Python 对其进行可视化。

自 5.1 版以来，KNIME Analytics Platform 在其框架中集成了一些 Gen AI 功能，也称为 KNIME AI 或简称 K-AI。特别是，所有 Python 节点都在配置对话框中提供了一个 K-AI 聊天机器人，工作流构建者可以在其中寻求有关如何编写所需的特定 Python 代码的建议。

Dennis 基本上是在和 K-AI 闲聊，要求编写 Python 代码来可视化 Minard 的数据。虽然第一次尝试并不令人满意，但他不断完善它，并提出了 K-AI 接受并包含在草稿代码中的进一步建议。在不影响 Dennis 编写 Python 代码能力的情况下，这里 K-AI（KNIME 的人工智能代理）完成了所有工作。

注意。请记住，K-AI 是 KNIME 扩展，必须在安装 KNIME Analytics Platform Core 后单独安装。还请记住，要查询 K-AI，你需要使用 KNIME Community Hub 上的免费帐户登录。

3、AI 可以创建 KNIME 工作流程

K-AI 还可以创建 KNIME 工作流程。

图 3. K-AI 在 KNIME Analytics Platform 中的运行情况。请注意顶部的“问答”和“构建”模式

自 5.1 版以来，KNIME Analytics Platform 已在其框架（称为 K-AI）中集成了一些 Gen AI 功能，以帮助用户构建工作流。如果安装了 K-AI 扩展，KNIME Analytics Platform 工作台左上角的第四个选项卡将引导至 K-AI 聊天区。在这里，用户可以与 K-AI 聊天以获取建议（“问答”选项）或构建工作流（“构建”选项）。Vittorio Haardt 的这篇文章教您什么是 LLM，以及 K-AI 如何帮助您节省组装工作流的时间。

K-AI 在构建 KNIME 工作流方面不如编写 Python 代码那么专业，但其工作流构建技能正在一个又一个版本中快速提高。

4、数据科学家还能做什么？

所有这些新的 AI 功能听起来有点让人不知所措，让我们想知道我们还能做些什么。尤其是作为数据科学家、模型训练师、Python 程序员、KNIME 工作流构建者，我们还能做什么呢？

首先，AI 不会自己构建东西，不会训练模型，不会编写 Python 脚本，不会构建 KNIME 工作流，只是因为。需要有人告诉它如何构建以及如何构建。在 Dennis Ganzaroli 的文章中，作者必须给出任务，然后不断完善，直到结果符合他的预期。即使在使用 AI 作为支持时，项目所有者仍然需要在后续步骤中描述整个过程：构建什么、如何构建、从哪些数据构建等等。

其次，AI 不会检查正确性。AI 提供结果。评估这是否正确不是其任务的一部分。AI 仍然需要由专家用户检查正确性：检查数据科学的正确性和业务健全性。为此，我们需要一个熟练的最终用户，他知道必须实现什么以及如何实现。

如果结果不正确或与提示的任务不符，最终用户需要通过更好的提示对其进行改进，或者手动添加缺失的部分。这直接引出了第三点：AI 模型的微调。现在出现了微调 AI 模型的趋势。为此，你肯定需要数据科学家。

继续 AI 生成的图像和图形设计师的平行，AI 可以生成各种图像。但是，只有最后的图形设计师才能验证图像质量并在需要时帮助改进。最近，我看到了太多丑陋的图像，当人们告诉我它们是 AI 生成的时，它们并没有得到改善。能够使用 AI 生成图像并不意味着你就是图形设计师。能够纠正和改进它们才是。

5、我们还需要数据科学家吗？

综上所述，我们将不再需要纯粹的实施者。尤其是对于基本任务，人工智能将变得越来越好，将使纯粹的实施者变得不那么必要。然而，我们仍然需要了解数据科学过程及其数学要求、知道如何纠正和重新定向人工智能工作以及如何解释人工智能生成结果的专业人士。在实践中，我们正在从创建和训练模型和服务转向使用和改进它们。

长话短说，我们仍然需要数据科学家。不过，这个角色在未来可能会发生变化。它将更多地关注算法和数据科学过程，而不是编程。同时，低代码工具将使整个过程的实施更加平易近人、速度更快。我们将需要更多的通用数据科学家，他们精通算法的数学，善于沟通，并善于引导和纠正人工智能以实现预期结果。

6、数据科学死了吗？

数据科学可能没有死，但它肯定在发生变化。最好的数据科学家不是能够更快地编写代码的人，而是能够更好地指导数据科学项目的组装的人，同时考虑到数据集成、数据质量、数据历史、机器学习算法、结果解释和过程的正确性。

我们会变得更加通才吗？可能，在数据科学项目的初始阶段，我们需要更多的通才来更多地参与这个过程。然而，我们仍然需要专家数据科学家来审查和纠正人工智能的输出。就像平面设计师一样，数据科学家将利用人工智能更快地实施解决方案，但仍需要对人工智能提供的解决方案的质量保持警惕。

原文链接：数据科学已死？ - BimAnt

新缸中之脑

关注

16
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
数据科学已死？

既然有了人工智能，训练自己的机器学习模型是否还值得？既然有了人工智能，学习 Python 是否还值得？既然有了人工智能，KNIME 还在营业吗？既然有了人工智能，数据科学是否仍然需要？或者我们应该宣布它已死？既然有了人工智能，我们还需要数据科学家吗？在这一长串问题中，我还要加上我的个人疑问：既然有了人工智能，我们还需要平面设计师吗？这些都是非常好的问题，虽然有点夸张。
复制链接

扫一扫