沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

持续学习有助于缩小数据科学技能差距

2022-12-07 14:59:444636

当讨论2022年及以后最受欢迎的IT工作时,“数据科学家”经常出现在许多列表的顶部。问题是,没有足够的具备适当技能的潜在数据科学家来满足当前的需求。事实上,一2022年调查发现56%的受访者认为数据科学人才或员工数量不足是企业成功采用数据科学的最大障碍之一。

为了克服这一障碍,组织应该考虑开发自己的数据科学持续学习计划,以补充学校教授的内容。此类项目有助于将初露头角的数据科学家展示给专业人士,以及将数据模型带入生活的过程。这些计划还可以帮助这些个人了解他们在机器学习运营(MLOps)生命周期中的位置,同时帮助公司找到急需的人才。

持续学习有助于缩小数据科学技能差距

需要数据科学家:“与他人合作愉快”

关键之一数据科学家的工作要求是能够与其他人合作愉快。这听起来可能令人惊讶,因为数据科学家的典型形象是与他们的模型隔离工作的人,但数据科学的实际建模部分实际上只是工作描述的一部分。

实际上,创建智能应用程序或模型是一个复杂的过程,涉及几个步骤,包括:

  1. 理解应用程序背后的业务目标
  2. 为应用程序收集和准备数据
  3. 开发模型
  4. 部署模型
  5. 部署后监控和管理模型

这些步骤中的每一步都由MLOps团队的不同成员来处理,该团队包括业务领导,数据工程师、开发人员和IT运营经理。不同步骤的职责之间自然会有一些交叉。尽管如此,数据科学家以某种方式参与其中,并且必须定期与其他领导者互动,以部署他们的模型。因此,理想的数据科学家既要有商业头脑,又要有技术专长,并且在与同行合作时能自如地处理模型。
 

为未来的数据科学家提供实践机会

在教授这些“软技能”方面,企业拥有独特的优势。这是因为许多组织已经有了MLOps团队,或者正在构建他们的MLOps能力。

这些团队有效地提供内置资源,帮助培养下一代数据科学家。组织可以邀请潜在的数据科学家(无论是来自公司内部还是外部)来了解团队如何工作、他们使用的工具、涉及的人物等等,并通过实际操作的持续学习计划来教授他们。

在这些计划中,潜在客户可以与当前的数据科学家并肩工作,了解他们如何与同事互动,并观察这些互动带来的微妙之处。他们可以问问题:把模型交给开发人员的最好方式是什么?运营经理喜欢如何与数据科学家合作?我如何确保我的模型最终成为一个有用的、可部署的应用程序?

学习贸易工具

学生还可以获得使用MLOps基础工具的宝贵经验。这些可能包括Jupyter笔记本,Apache Spark,计算机编程语言,以及数据科学家中常见的其他技术。这将帮助他们更好地理解开发人员用来创建代码和应用程序的技术,以及数据工程师用来提取和转换数据的解决方案

虽然数据科学专业的学生不需要成为容器或最新的MLOps治理软件等技术的专家,但了解谁使用了什么技术以及为什么使用会很有帮助。每一点额外的知识都会让学生更好地理解团队中的每个人是如何工作的,并帮助他们与团队成员更紧密地合作,以便他们能够更有效地交付模型。

对组织的好处

为数据科学家创造持续的学习体验也有利于公司。例如,组织可以就自己独特的流程培训未来的数据科学家,并让潜在的新员工适应他们的MLOps文化。如果学生表现出必要的能力,他们可能会考虑聘用他们,并加入他们的数据科学行列。由于他们的持续学习计划,他们将有一名已经接受过培训并准备在第一天就投入工作的新员工。

至少,有持续学习项目的公司表明他们有兴趣投资于他们的员工。仅仅这一点就可以成为一个不同的制造者,可以激发员工群,这将有望包括更多未来的数据科学家。