沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

为什么没有大数据人工智能就无法生存

2022-10-17 11:52:094636

毫不奇怪,互联网已经随着数据量的增加而膨胀,以至于难以跟踪。如果在 2005 年我们只处理 0.1 泽字节的数据,那么现在这个数字刚刚超过 20 泽字节,甚至估计到 2020 年将达到惊人的47 泽字节。除了数量庞大之外,问题在于事实它主要是非结构化的。没有什么比为 AI 提供不完整或不准确的数据更有害的了。

似乎我们只处理了大约 10% 的结构化数据,而其余的只是一大堆没有标记的信息,机器无法以建设性的方式使用。为了更好地理解这个主题,很高兴知道电子邮件不符合结构化数据的条件,而电子表格等任何内容都被视为已标记并且可以被机器成功扫描。

这似乎没有什么问题,但如果我们期望人工智能能够改善我们在医疗保健、无人驾驶汽车、联网家庭等领域的生活,我们需要拥有干净且有组织的数据。具有讽刺意味的是,我们已经非常擅长创建内容和数据,但我们还没有找到一种方法来准确地利用它来满足我们的需求。

为什么没有大数据人工智能就无法生存

数据科学家也在苦苦挣扎

很自然,数据科学是在过去几年中取得了很大进展的领域之一,越来越多的数据科学家致力于解决这个烂摊子。然而,最近的一项调查显示,与流行的观点相反,数据科学家花在构建算法和挖掘模式数据上的时间要少得多,而是花在做所谓的数字清洁工作——清理和组织数据上。正如你所看到的,这些数字肯定不利于人工智能的光明未来。

人工智能阻碍人类灭绝的预测者显然没有考虑到这样一个事实,即虽然机器可以成功取代少数数据科学家,但它们可能无法取代绝大多数致力于挖掘数据的科学家。他们大部分时间都在收集、清理和组织这些数据。当然,最好从一开始就以更完整的方式简单地收集数据,而不是分配如此多的时间和资源来追溯“修复”它。幸运的是,人工智能领域的领导者也慢慢地达成了这种理解,利用他们的技能和影响力来改变数据科学的发展方向——并且隐含着人工智能。

人工智能很好,但还不是人类好

我们都听说过机器在面对真正的人类时被证明是超人的案例,例如世界上最好的围棋选手被谷歌的 AlphaGo AI 击败的案例。然而,这仅表明人工智能能够在小众任务中取得惊人的成绩,但其整体能力仍然无法与人类能力相提并论。人工智能根本无法处理许多微妙之处和逻辑步骤。

在处理财务文件和法律术语时,人工智能的局限性更加明显。这里的问题和其他地方一样。只要不向 AI 机器提供结构化数据,例如标准化合约,它们就会被严重混淆。这意味着,目前仍由合格的数据科学家来解决这个烂摊子。

只有当每个人都作为一个团队工作时,有效的人工智能才是可能的

聘请高素质数据分析师的成本很高,这使得在该领域取得进展更加困难。关键是通过可以简化流程的技术来完成收集和建模阶段。

另一个关键方面是多部门共同努力应对和解决大数据带来的问题。财务和技术专家需要携手合作,以便从一开始就正确识别他们收集的数据中的潜在缺陷。这些专家解决问题的方式也应该被注册,以便随后被机器成功复制。目标是创建质量保证算法,该算法可以查明与过去错误相关的建模结果。我们能够创建的此类模型越多,数据错误和违规行为的空间就越小。

没有大数据,人工智能就无法生存

不管人工智能的发展方向是什么——无论它对人类是好是坏——有一件事是肯定的:没有大数据,人工智能就无法去任何地方。我们已经有日常生活中的例子,我们很可能认为这些例子是理所当然的,这证明了人工智能在它们的存在中是多么必要。以 Cortana 或Siri为例。他们之所以能够理解我们的问题和疑问,只是因为他们获得了无穷无尽的信息,帮助他们理解了我们的自然语言。谷歌已经成为一个无所不知的巨大力量,它对我们每一个人都了如指掌,这仅仅是因为我们每天在其搜索引擎上的大量条目。为此,公司还能够制作准确的报告——例如,那些可以使用 revcontent 识别网站的公司,这要归功于最初收集该数据的整洁性。

由于 AI 与大数据的联系如此紧密,因此只有访问干净、结构化的数据才能以改善我们生活的方式进行处理才有意义。幸运的是,世界正在逐渐了解人工智能进步背后的需求。这就是为什么我们注意到数据科学家在资金、工资、可用工具和设备方面的工作方式有所改善。

这种意识正在全球范围内慢慢传播,使公司和专家能够相互合作,以便更有效地收集数据,建立可以进一步帮助机器清理和结构化数据的模型,并为子孙后代奠定基础。知道人工智能和大数据的问题出在哪里意味着问题已经解决了一半。