沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

应用AI和MLOps的成长阶段

2022-08-30 09:00:004636

应用机器学习

图片来源:123RF

在麦肯锡公司的“2022年技术趋势展望”报告中,应用人工智能位居14种最具影响力的技术趋势之首。

目前,应用人工智能(也可以称为“企业人工智能”)主要是机器学习和深度学习模型在实际应用中的使用。进入麦肯锡前14名的一个密切相关的趋势是“机器学习工业化”,它指的是MLOps平台和其他工具,它们可以更容易地在不同的应用程序和环境中训练、部署、集成和更新ML模型。

麦肯锡的调查结果与咨询和研究公司发布的类似报告一致,表明经过十年的投资、研究和工具开发,应用人工智能的障碍正在慢慢消失。

大型科技公司通常拥有许多顶尖的机器学习/深度学习科学家和工程师,多年来一直在研究新算法并将其应用到他们的产品中。由于麦肯锡报告中强调的发展,更多的组织可以在他们的应用程序中采用机器学习模型,并为他们的客户和用户带来好处。

应用机器学习的挑战

近十年来,人们对人工智能的主流兴趣得到了复苏和增长,这主要归功于深度神经网络在执行以前被认为超出计算机限制的任务方面的成熟能力。在同一时期,机器学习研究界在人工智能的一些具有挑战性的领域取得了令人瞩目的进展,包括计算机视觉和自然语言处理。

由于收集、存储和访问不同领域数据的能力不断增强,机器学习的科学突破在很大程度上成为可能。与此同时,处理器和云计算的进步使得以以前被认为不可能的速度和规模训练和运行神经网络成为可能。

深度学习的一些里程碑式的成就紧随其后的是宣传(并且经常夸大)当代人工智能能力的新闻周期。今天,许多公司试图将自己标榜为“人工智能优先”,或者将他们的产品宣传为使用了最新最好的深度学习。

然而,将ML从研究实验室带到实际产品会带来一些挑战,这就是大多数机器学习策略失败的原因. 创建和维护使用机器学习的产品需要与传​​统软件中使用的不同的基础架构、工具和技能集。组织需要数据湖来收集和存储数据,需要数据工程师来设置、维护和配置数据基础设施,以便训练和更新ML模型。他们需要数据科学家和ML工程师来准备为其应用程序提供动力的数据和模型。他们需要分布式计算专家,这些专家可以使ML模型以时间和成本高效的方式大规模运行。他们需要能够使ML系统适应他们的业务模型的产品经理和能够将ML管道集成到他们的产品中的软件工程师。

企业AI带来的数据、硬件和人才成本对于小型组织而言往往过于高昂,无法对ML战略进行长期投资。

正是在这种背景下,麦肯锡公司报告的调查结果值得研究。

应用人工智能的增长

自动化放大增强

该报告根据五个可量化的指标对技术趋势进行排名:搜索引擎查询、新闻出版物、专利、研究出版物和投资。值得注意的是,这样的量化指标并不总是能最准确地描绘出趋势的相关性。但是随着时间的推移跟踪它们可以很好地估计一项技术如何通过炒作、采用和生产力周期的不同步骤。

麦肯锡通过对来自20个不同行业的专家的调查和访谈进一步证实了其调查结果,从而更好地了解了机遇和挑战。

该报告基于2018-2021年的数据,并不能完全解释资本市场目前正在经历的低迷。根据调查结果,除了“搜索引擎查询”​​类别(这是一个灰色区域,因为人工智能术语和趋势在不断发展)之外,应用人工智能在所有可量化的指标中都出现了增长。麦肯锡在2021年以1650亿美元的价格为应用人工智能提供了最高的创新分数和前五名的投资分数。

(衡量投资也是非常主观的,取决于你如何定义“应用人工智能”——例如,如果一家获得巨额资金的公司将机器学习作为其产品的一小部分,它是否算作对应用人工智能的投资?)

在行业相关性方面,报告中提到的部分机器学习应用包括推荐引擎(如内容推荐、智能追加销售)、检测与预防(如信用卡欺诈检测、客户投诉建模、疾病早期诊断)等用例、缺陷预测)和时间序列分析(例如,管理价格波动、需求预测)。有趣的是,这些是机器学习的一些领域,这些领域的算法已经发展了多年。尽管计算机视觉在用例中只提到过一次,但一些应用程序可能会从中受益(例如,文档扫描、设备缺陷检测)。

该报告还提到了机器学习的一些更先进的领域,例如生成深度学习模型(例如,用于自动驾驶汽车的模拟引擎、生成化合物)、变压器模型(例如,药物发现)、图神经网络和机器人技术。

这进一步说明了采用应用人工智能的主要障碍不是糟糕的机器学习算法,而是缺乏工具和基础设施来有效使用众所周知的和经过测试的算法。这些限制将应用人工智能限制在没有大量资源和稀缺机器学习人才的公司中。

近年来,在其中一些方面取得了巨大进展。我们已经看到了无代码机器学习平台、易于使用的机器学习编程库、基于API的机器学习服务(MLaaS)以及用于训练和运行机器学习模型的特殊硬件的出现和成熟。与此同时,ML服务底层的数据存储技术已经发展为更加灵活、可互操作和可扩展。与此同时,一些企业AI公司已经开始为特定行业(例如,金融服务、石油和天然气、零售)开发和提供ML解决方案

所有这些发展都减少了在其商业模式中采用机器学习的财务和技术障碍。在许多情况下,公司可以将ML服务集成到他们的应用程序中,而无需深入了解后台运行的算法。

根据麦肯锡2021年对行业专家的调查,“56%的受访者表示他们的组织已采用人工智能,高于2020年调查的50%。2021年的调查还表明,采用人工智能可以带来经济利益:27%的受访者将其公司5%或更多的息税前利润归因于人工智能。”

MLOps的进展

开发运维

麦肯锡公司报告中包含的第二个与人工智能相关的技术趋势是“机器学习的工业化”。这是一个模糊的术语,与应用的AI类别有很多重叠,因此该报告将其定义为“一个可互操作的技术工具堆栈,用于自动化ML并扩大其使用范围,以便组织能够充分发挥其潜力。”

该领域进步的基础技术与导致应用AI增长的技术基本相同(更好的数据存储平台、硬件堆栈、ML开发工具和平台等)。然而,近年来取得令人瞩目发展的一个特定领域是机器学习操作(MLOps),这是一套简化ML模型的训练、部署和维护的工具和实践。

MLOps平台提供用于管理、处理和标记数据的工具;训练和比较不同的机器学习模型;数据集和模型的版本控制;部署ML模型并监控其性能;随着性能下降、环境变化和新数据可用时更新ML模型。MLOps平台的数量和成熟度都在增长,它汇集了以前以临时方式拼命执行的几个不同任务。

根据该报告,机器学习的产业化“可以将ML应用程序的生产时间缩短90%(从概念验证到产品),并将开发资源减少多达40%。”

企业AI仍面临挑战

机器学习编程

尽管应用人工智能取得了进展,但该领域仍有一些差距需要弥补。麦肯锡报告指出,人才和资金等资源的可用性仍然是企业AI进一步发展的两个障碍。目前,资本市场处于低迷状态,包括人工智能在内的所有行业都面临着为初创公司和公司提供资金的问题。

然而,尽管人工智能的资本蛋糕越来越小,但资金并没有完全停止。根据CB Insights最近的一份报告,已经实现产品/市场契合并准备好积极增长的公司仍在设法获得巨额融资(超过1亿美元)。这表明,没有利润推出新的机器学习战略的公司将很难获得外部资金。但已经占据市场份额的应用ML平台将继续吸引投资者的兴趣。

报告提到的另一个重要挑战是数据风险和漏洞。对于应用机器学习来说,这正成为一个越来越重要的问题。与其开发生命周期一样,机器学习的安全威胁格局也不同于传统软件。大多数软件开发平台中使用的安全工具并非旨在检测对抗性示例、数据中毒、成员推理攻击和其他类型的针对ML模型的威胁。

幸运的是,安全和机器学习社区正在共同开发用于创建安全ML管道的工具和实践。随着应用人工智能的持续增长,我们可以期待其他行业加快采用机器学习,这反过来将进一步加快该领域的创新步伐。