给我一个入行的理由:进入数据科学领域之前必须了解的三件事

559 篇文章 5 订阅

全文共1913字,预计学习时长6分钟

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

图源:unsplash

 

毫无疑问,数据科学如今已经成为并将持续是最热门的职业选择领域,很多人一个猛子扎进了这一领域当中。但是,这个21世纪最热门的职业并不一定适合所有人,这不是说数据科学不值得,恰恰相反它几乎就是为了解决实际问题而生的。

 

当然啦,本文仅代表作者观点,可能存在一定偏颇。不同国家地区的职业设置以及各人掌握的技能存在差异,因而每个人看世界的角度都不一样。我只从我的经验和角度聊聊我的想法。

 

入行以来,笔者每天花费10到12小时在数据科学领域中,撰写了将近100篇相关文章,自认为已有资格对这个领域里的某些现象发表一点见解,那些现象令人失望却鲜有人提及。对笔者而言,实用数据科学是最有趣的领域之一,尤其是在进一步深入学习之后更有体会。

 

然而,为了数据科学而从事数据科学的意义何在呢?这么说吧,除非是研究人员,否则全职从事这个行业几乎没有任何意义。花费大量时间训练模型的理由何在呢?模型会被应用在网页和/或者手机app中吗?是会被用来解决一些实际问题吗?还是只会被闲置在电脑上呢?

 

数据科学似乎正在成为软件开发的另一个分支。这不见得是坏事,现如今模型训练和优化(只要用对工具)几乎全部都是自动化的,而“数据科学家”需要做的,仅仅是以恰当的方式准备数据,以及向上级汇报工作。

 

这或许是件好事,你有了更多时间去做有趣的事情,从而交付整个数据包并实际解决问题,而不会将模型闲置在电脑上。

 

但是,如果计划在这个领域谋求一份全职工作,请先读一读本文,看看行业光鲜外表下的其它方面,了解进入这个行业的优势和可能存在的劣势是很有必要的。

 

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

 

1.不关心业务

 

先说明一下,除了在Medium和TDS上发表博文以外,笔者还是一个全职的数据科学家。笔者所就职的公司并不专门从事于数据科学的某个分支,仅仅是一家以咨询为主的IT公司。

 

这意味着笔者并不专注于一个项目或一个产品,而是同时推进三到五个不同行业的不同项目。是的,笔者并不精通于那些行业里的任何一个。这可能是很多人不喜欢数据科学工作的原因,你对所工作的领域了解不多,从业者也并不愿意去学习那么多东西。

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

图源:unsplash

 

不过,对于某些在相关领域从事数据科学的人而言,情况可能并非如此。假设一个人已经在X领域接受了专业教育,并且对数学和统计学掌握得不错,因而被聘用在该领域里从事大量重数据型工作,这就皆大欢喜了。

 

我所指的是通才型数据科学家,就是那种从一个项目转移到另一个项目工作,但是感觉自己从来没有做出实际贡献的人。

 

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

 

2.缺乏全局观

 

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

图源:unsplash

 

这个缺点对数据科学领域的通才和专家都适用。

 

假设有某个项目团队的app需要“数据科学魔法”的加持,于是邀请了一位数据科学家参加会议。这位数据科学家一定会被问到这些问题:

 

· 你的模型可以做到这点吗?

· 这些现代神经网络可以用在10KB的数据集上吗?

· 你能只用30行数据做一个预测模型吗?

 

这就是问题所在了。在完全不了解项目及其架构的情况下,就必须很快提供一个最先进的解决方案,也就是所谓的全局观问题。

 

对于专家型数据科学家可能还没那么麻烦,因为他们至少具备了某些领域的专业知识,并且了解如何去适应全局,这使他们能够相对轻松地完成工作。

 

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

 

3.老板是商人

 

外行领导内行这件事很容易闹出一些荒谬的困难。如果你的上级不是数据相关领域的专家,那么他们对于数据科学的了解与任何一个普通人从新闻里了解到的没什么两样。

 

不过,这个问题带来的影响大小在不同的国家是不同的,毕竟不同国家的工作和生活文化可能存在很大差距。

 

而这带来了一个潜在的问题,团队可能接到一项任务,其研究工作需要数月才能完成,但是从商业角度来说这不太可行。理想的情形是,部门主管能够理解特定解决方案所需要的时间之长和工作量之大,然后在上一级那边帮忙交流疏通,但这样的主管可遇而不可求。

 

这时就是良好的人际交往能力派上用场的时候了。给你的老板解释清楚为什么花一两个月去搜查100项用不上的东西,这不是一件轻松愉快的事情,但掌握人际交往和项目展示的技巧可能会让局面更好一点。

 

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

图源:unsplash

 

在笔者看来,只有在有实际问题需要解决时,只深耕于数据科学和预测建模的全职数据科学家才有立足之地。归根结底,数据科学只是一种技能,不应用于解决业务问题就毫无价值。如果不关心相关业务,或者仅仅是不了解业务情况,都可能让工作无法顺利开展。

 

所以,是否要入行,还请你三思。

给我一个入行的理由:进入数据科学领域之前必须了解的三件事

一起分享AI学习与发展的干货
欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
下面是一个示例的 `generate_entry` 类的实现,它每隔一秒钟生成一个 `entry`,并对每个 `entry` 执行装载箭、装载弓和装载弦的操作: ```cpp #include <iostream> #include <thread> #include <chrono> class generate_entry { public: void start() { // 创建一个新线程来生成 entry std::thread t(&generate_entry::generate, this); t.detach(); // 在后台运行线程,不阻塞主线程 } private: void generate() { while (true) { // 生成一个 entry Entry entry; // 装载箭 loadArrow(entry); // 装载弓 loadBow(entry); // 装载弦 loadString(entry); // 处理 entry processEntry(entry); // 暂停一秒钟 std::this_thread::sleep_for(std::chrono::seconds(1)); } } void loadArrow(const Entry& entry) { // 装载箭的逻辑 std::cout << "Loading arrow for entry" << std::endl; } void loadBow(const Entry& entry) { // 装载弓的逻辑 std::cout << "Loading bow for entry" << std::endl; } void loadString(const Entry& entry) { // 装载弦的逻辑 std::cout << "Loading string for entry" << std::endl; } void processEntry(const Entry& entry) { // 处理 entry 的逻辑 std::cout << "Processing entry" << std::endl; } // 定义一个 Entry 类,用于表示每个生成的 entry class Entry { // Entry 类的成员和方法 }; }; ``` 使用示例: ```cpp int main() { generate_entry generator; generator.start(); // 主线程继续执行其他操作 // ... return 0; } ``` 上述代码定义了一个 `generate_entry` 类,其中 `start` 方法用于启动一个新线程来生成 `entry`。在 `generate` 方法中,通过循环生成 `entry`,并依次执行装载箭、装载弓和装载弦的操作。然后调用 `processEntry` 方法处理生成的 `entry`。通过使用 `std::this_thread::sleep_for` 函数暂停一秒钟,以控制生成 `entry` 的时间间隔。 注意:上述代码中的 `Entry` 类需要根据实际需求进行定义,并根据需要添加成员和方法。 你可以根据实际需求修改该示例代码,并根据需要添加其他的功能和逻辑。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值