沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

2023年大数据行业预测

2023-11-02 09:23:184636

2023年大数据行业预测

到2023年,大数据技术和产品日益成熟,从而提高企业数据的质量和信任度。这将导致企业内部出现更健壮的数据组织,从而增加对数据建模技术和数据团队/工程师的需求。

Coalesce公司联合创始人兼首席执行官Armon Petrossian指出,随着企业推动变革,数据市场将不断发展。随着DBT、Snowflake、Databricks等技术的兴起,过去十年一直是云计算和现代数据栈的时代。虽然这种趋势对中小型企业影响极大,因为它们可以在几分钟内启动数据平台,但大型企业面临着不同的挑战,主要围绕现代化、变更管理和治理。这就是数据沿袭开始发挥关键作用的地方。如今的数据市场极其分散,其中一个大问题是,尤其是考虑到经济衰退以及数据是否会整合,以及如何整合。2023年,人们可能会看到更多的并购。此外,希望在非技术方面有更多的发展,包括数据契约、数据网格或高级联邦治理流程,因为对于任何成熟的数据组织来说,这似乎是数据之旅的下一个明显步骤。

Ocient公司首席执行官兼联合创始人Chris Gladwin指出,数据复杂性将增加:数据的性质正在发生变化。随着结构化数据和半结构化数据之间的界限越来越模糊,数据类型越来越多,数据类型也越来越复杂。与此同时,用于管理和分析数据的软件和平台也在不断发展。一类新的专用数据库专门处理不同的数据类型——图形、向量、空间、文档、列表、视频等等。下一代云数据仓库必须具有多功能性,能够原生支持多模式数据,以确保其处理的工作负载的性能和灵活性。例如,OcientHyperscaleDataWarehouse支持数组、元组、矩阵、行、多边形、地理空间数据、IP地址和大型变长字符字段。在数字化转型和全球业务需求的推动下,分析新的、更复杂的数据类型(包括半结构化数据)的需求将在未来几年得到加强。例如,电信网络运营商可能希望分析网络元数据,以了解其交换机和路由器的健康状况。或者远洋运输公司可能想要运行地理空间分析来进行物流和路线优化。

Snowplow公司首席数据官(CDO)Chris Lubasch说,2023年将是围绕现代数据栈进行快速讨论的一年。许多新的供应商将会出现,像Snowflake和Databricks这样的主要供应商继续他们的旅程,接管了许多技术组件,尽管经济形势充满挑战。但与此同时,也出现了质疑现代数据堆栈的声音,这些数据堆栈的解耦方法往往会导致许多工具和高成本,更不用说将它们组合在一起的复杂性了。围绕“后现代数据栈”的讨论已经开始,人们都渴望看到这将在未来几年引向何方。

Fivetran公司产品总监Alexander Lovell表示,2023年将是数据团队开工或停工的时间。尽管回报质量存在很大差异,但企业仍保持了对IT的投资。在经济领域普遍存在困惑的情况下,是时候让数据团队通过提供可操作的见解而大放异彩了,因为当市场处于波动之中时,高管的直觉不那么可靠。最好的数据团队将会成长并变得更加重要。不能产生可操作见解的数据团队将面临更大的预算压力。

MANTA公司研究与教育副总裁Jan Ulrych说,元数据将由数据谱系驱动。元数据是当今最引人注目的数据策略趋势。然而,这不仅仅是收集元数据,而是通过激活来释放它的力量。数据沿袭是元数据的基本类型,能够提供最强大的好处。如果操作得当,它可以实现自动化和智能的数据管理实践。

元数据是当今最引人注目的数据策略趋势。然而,这不仅仅是收集元数据,而是通过激活来释放它的力量。数据沿袭是元数据的基本类型,能够提供最强大的好处。如果操作得当,它可以实现自动化和智能的数据管理实践。

Snowplow公司联合创始人Yali Sassoon表示,在2023年,“数据产品经理”和“数据产品管理”将会兴起,作为将数据视为产品、设计和实施正确的数据合同(作为数据产品的一部分)以及使组织构建“数据网格”所需的关键人物/关键技能集。此外,预计更多的组织将在云数据仓库和数据湖上构建可操作(包括实时)用例,并由核心供应商(如Databricks和Snowflake)和生态系统中的公司提供更好的工具支持。最后,预测将会有更周到的方法/技术架构来管理个人身份数据的数据民主化和数据遵从性之间的紧张关系。增加对测量数据投资的投资回报率的关注。

vFunction公司首席生态系统官Bob Quillin表示,迭代取代大爆炸:对于高度复杂的大规模现代化项目,业务领导者可能会寻找“简单的按钮”,但首席技术官和软件架构师知道现实情况大不相同。从一个整体中开发出微服务是一个迭代过程,通常需要重构和平台化。除非您的应用程序相当简单,否则“一次一个”的方法是确保成功和管理风险的推荐方法,并实际上提高项目速度。尝试一次性做太多事情,或者尝试“大爆炸”的现代化或重写是大多数应用现代化项目失败、失败或失败的原因。这并不一定像看起来那样缓慢而稳定,因为迭代构建的速度将在短时间内超过任何大规模的任务。

Cherre公司客户解决方案高级副总裁Raj Bhatti表示,在过去的几年里,大数据被认为是一种将颠覆多个行业的技术。然而,由于元数据驱动的数据结构、AutoML和不断增长的数据种类的进步,大数据的采用已经激增。

数据技术社区在2022年开始讨论元数据驱动的数据结构。由于数据结构中的主动元数据辅助自动化功能减少了人力资源的使用,同时提高了数据利用率,因此该技术将在2023年获得巨大的吸引力。数据结构监听、学习并对元数据或“场景中的数据”采取行动,这有助于用户访问场景信息。关键的战略区别之一将是能够访问场景数据。

由于AutoML的出现,机器学习(ML)将在明年变得更容易为非专家所接受。这是一类机器学习算法,有助于自动化机器学习模型的设计和训练。机器学习模型是由人类构建的算法创建的。

许多企业现在要么有内部人才,要么有合作伙伴,他们已经交付了成功的大数据驱动解决方案。这些有据可稽的成功故事,加上更有效的分析技术,使得商业成果越来越成为大数据项目中必不可少的过滤器。因此,在2023年,预计很少会遇到使用研发预算的大数据项目。

大数据在2023年将变得触手可及的一年。大多数公司现在都明白数据作为一种资产的价值,但许多企业仍在努力挖掘它的真正价值。尝试这样做在一定程度上推动了托管数据库即服务和/或数据管理即服务的增长,从而降低了复杂性。2023年,人们将看到这一过程的下一步,企业高管将开始采用数据可视化平台和工具,以更好地理解大数据,并利用它做出更明智的决策。