沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

基于数据的决策:使用数据库中的机器学习预测未来

2022-12-07 14:46:334636

在短短几年内,机器学习(ML)已经成为一项基本技术,公司几乎在业务的每个方面都部署了这项技术。以前是财大气粗的大型机构的领地,ML市场正在迅速开放。各种生意现在可以利用ML来最大限度地减少重复的手动过程,自动化决策制定,并预测未来趋势。几乎在任何商业任务的每一个阶段,ML都在使流程更智能、更精简、更快速。

近年来,技术进步有助于民主化访问并通过减少获得ML驱动的预测所需的时间、技能水平和步骤数量来推动ML的采用。增长如此之快,以至于全球ML市场预计将从2022年的210亿美元增长到2029年的2090亿美元。声明式ML和AutoML等工具正在帮助企业访问强大的业务关键型预测分析。将这些方法向前推进一步,数据库内ML是一种正在普及的新技术。它允许企业轻松地向他们的数据提出问题,并使用标准的SQL查询快速获得答案。

基于数据的决策:使用数据库中的机器学习预测未来

什么是数据库内ML?

传统上,构建ML模型是一项高技能、冗长、资源密集型的工作。ML计划的典型时间框架以月为单位。项目耗时超过六个月的情况并不少见,需要花费大量时间从数据库中提取、清理和准备数据。

相比之下,数据库内ML将分析引入到数据库中,使企业能够获得您期望从传统的完全定制的ML模型中获得的洞察力,但有一些重要的差异。数据库内ML获得这些结果要快得多(几天或几周,而不是几个月),因为数据永远不需要离开数据库。另一个区别是,数据库内建模是使用常规的、现有的数据库技能(如SQL)来完成的,这使得更广泛的it团队更容易处理它。

虽然这是一个相对较新的领域,但它现在是GitHub明星代言中增长最快的领域。事实上,现在所有主要的数据库供应商、ML框架、BI工具和笔记本都有数据库内ML集成。

企业如何使用数据库内ML?

从人力资源到市场营销到销售再到生产,在每个业务领域都有使用案例,从数据库中获得的预测正在帮助公司改善客户体验,提高产品个性化,优化客户终身价值,增加员工保留率,更准确地评估风险,并提高工作场所的生产力。

举一个生产力软件领域的例子:Rize是一个智能时间跟踪器,它使用户在工作中更有生产力和效率,使用数据库内ML开发了一个强大的功能,在几周内响应用户反馈。由此产生的能力——由ML生成的洞察驱动——提高了客户保持率和转化率。它还帮助Rize在竞争激烈的市场中脱颖而出,巩固了其作为真正智能时间跟踪器的地位。

数据库内ML重塑行业的速度和规模

尽管这些用例中有许多有利于各个行业或地区的企业,但特定的行业应用正在出现,这些应用可以实时提供未来的见解,其建立成本只是传统ML算法的一小部分,并开始破坏这些市场中的现有价值链。

金融部门一个快速实施传统ML建模的行业现在正转向数据库内建模以提高敏捷性。金融服务和金融科技公司正在使用数据库内ML来检测欺诈、帮助贷款回收、提高信用评分和批准贷款。因此,他们能够更快地对市场状况做出反应,调整他们提供的服务,甚至开辟新的收入来源。

例如,下一代多家庭租金支付处理平台Domuso使用数据库内ML每年节省50万美元。Domuso培训并部署了一个数据库内ML模型,以准确预测租金付款是否可能因资金不足而被退回。“使用数据库内ML,我们可以更快地实施高级模型,而且复杂性更低,”时任Domuso产品和运营副总裁的Sameer Nayyar说。“这对我们的业务产生了积极影响。我们看到两个月内退款减少了95,000美元,第一年节省了500,000美元。”此外,随着新用例的出现,Domuso现在能够在几周内创建和实现新的ML模型,而不是几个月。

零售、快速消费品和食品生产等行业已经很快意识到实时预测数据库内建模,帮助他们响应市场条件,提供“即时”和特定位置的产品。管理库存、预测特定商品的需求、优化人员配备水平和预测未来价格只是零售和其他业务如何转向数据库内ML算法来解决日常挑战的几个例子。

以Journey Foods为例,这是一个用于食品开发和创新的供应链和食品科学软件平台,它使用数据库中的ML来应对不断变化的配料价格的挑战。他们希望利用22,000家供应商的130,000种食品原料数据库,预测其客户在一个月、三个月、六个月和12个月内的食品成本。由于配料和供应商总是在变化,他们担心绘制这些复杂的“多对多”关系所需的预测分析需要大量时间来建立,并且需要持续的维护和重新培训。Journey Foods求助于数据库内的ML来开发其成本预测模型,从而实现了对食品成分的高精度预测。与他们最初考虑的本土ML模型相比,这也大大降低了运营成本。

提高业务灵活性和创新

还有很多特定行业的例子,但是推动这种快速增长的开源运动的共同因素是速度和规模。数据库内ML使复杂的预测分析可用于任何有数据库的企业。

例如,在最近的开源数据库内ML黑客马拉松Hacktoberfest上,不断增长的数据库内ML程序员社区恰当地展示了创新的潜力。在活动过程中,团队提交了20多个新的数据库处理程序,包括与Apache Impala和Solr、PlanetScale和Teradata的连接,以及10多个新的机器学习处理程序,包括PyCaret、Ray Server和Salesforce。

数据库内分析仍处于早期阶段。就像更广泛的人工智能行业一样,ML细分市场对炒作并不陌生。然而,随着对复杂问题的快速回答不再仅仅是理论上可能的,而是在短期内由各种规模和预算的企业可以实现的,数据库内ML值得认真考虑。通过切割建立模型所需的时间通过让没有数据科学背景的人来运行项目,它大大降低了与预测分析相关的成本。基于数据的决策为企业提供了传统ML技术的可行替代方案:在速度和规模上完全可定制的预测能力。