沃卡惠行业资讯

资讯详情

播客的未来是人工智能

2022-11-07 09:16:224636

粗略地说，一个月内推出了大约 22,000 个新播客。根据Podcast Industry Insights的数据，Apple Podcasts 目录中目前有近 250 万（超过 7100 万集）。这些只是我们所知道的。

“现在很多播客甚至都没有通过大平台。他们直接面向听众，销售优质内容并取得了巨大的成功，”英国广播公司电台前任工作人员、卡迪夫研发咨询公司Bwlb的创始人安迪·泰勒说。

更不用说越来越多的类似播客的内容，无论是由品牌为促销或活动制作人创建的，例如，想要按需提供谈话。每一条内容都需要制作和分发，无论是由音频专业人士还是学习手艺的人。因此，他们越能自动化大量生产，就越能专注于内容。

“音频发布的不同地方刚刚爆炸式增长，”M Works Mastering的首席工程师和波士顿伯克利音乐学院的教授Jonathan Wyner 解释道。“在所有这些背景下，创作者有真正的动机和必要性来变得更加多才多艺。”

更不用说，更有生产力和效率。

人工智能的兴起

人工智能（AI）——可以自动化以前由人类完成的任务的软件——是处理播客内容海啸的关键。AI 不仅可以加快制作速度，还可以让播客听起来更好，并为明天的音频体验奠定基础。

“人工智能基本上有助于处理重复性任务，以加快播客的工作流程，”开发基于人工智能的播客工具的Nomono研究工程师 Manos Chourdakis 解释道。“例如，有了人工智能，你不必听整个播客就可以找到有人说错了什么，然后替换或删除它。你可以自己做，但人工智能做得更快。”

还有一些只能用人工智能完成的家务——至少在规模上是这样，比如消除噪音或增强对话。“如果没有人工智能，高质量的对话增强是不可能的，”Chourdakis 说。“至少在合理的时间范围内使用传统工具是不可能的。”

非常适合琐碎的任务

人工智能在播客中的应用与生产任务一样多种多样。有些直接内置到播客平台中。当创作者将他们的播客上传到托管平台Podcast.co时，系统会自动“收听”音频文件并标准化音量。

“任何可以帮助减少工作中令人麻木的工具都是一件好事，”该平台的联合创始人 Mike Cunsolo 说。Cunsolo 还经营着与企业品牌合作的播客制作公司Cue和将播客制作人与客人联系起来的Matchmaker.fm 。“你总是需要人类的专业知识元素，但很快机器就可以学会理解是什么让播客变得有趣，并减少了完成任务的时间。”

解决方案提供商Descript将 AI 应用于播客工程的许多方面，包括去噪和回声控制。Descript 可以处理的更“令人麻木”的家务之一是房间音调。

“有时制作人需要在播客中插入数字静音。可能是在编辑之间，或者是为了拉长句子之间的间距，”Descript 的业务和企业发展主管 Jay LeBoeuf 说。“但这听起来非常不自然。”

如果制作人在录制播客时没有捕捉到房间音调，他们可能不得不回去获取它。或者他们可以在录音中聆听，在需要的地方复制粘贴，然后编辑结果使其自然融合。

或者计算机可以处理它。Descript 基于 AI 的房间音生成器分析录音，识别房间音，并在需要的地方自动合成。这种技术不仅避免了繁琐的任务，还提供了更大的生产灵活性。

Nomono 的 Chourdakis 说：“人工智能将允许我们使用更便宜的硬件、更差的房间和更嘈杂的位置，并且仍然可以获得良好的结果。”

新的基于人工智能的能力

人工智能还为播客创新打开了大门——创造新的解决方案，提高播客和听众的标准。例如，流行音频参考 (EAR) 工具可帮助播客根据他们喜欢的歌曲找到无版权的音乐。

“假设您正在寻找前奏或结尾音乐，并且您正在考虑一首特定的歌曲，但它受版权保护，”Chourdakis 说。“该系统在后台使用 AI 来帮助您找到类似的东西。”

在 Bwlb，Taylor 的团队开发了Accordion，这是一种基于 AI 的解决方案，可以接收播客并以各种长度进行复制。

“我们生活的每一部分都变得越来越智能——智能家居、智能冰箱，”泰勒说。“人们也希望从播客体验中获得更多控制和便利。”

当泰勒为 BBC 制作纪录片时，他会被要求提供更短的版本以在不同的平台上运行。该过程始终是手动的。Accordion 将软件算法应用于播客内容，以智能地创建不同长度的版本。“它不会加快任何速度，”Taylor 说，“但它让用户可以控制内容的持续时间，而不会失去音调结构或可听性。”

专注于沉浸式讲故事

播客使用人工智能工具越多，他们就会变得越好。换句话说，他们摄取的数据越多，他们学到的就越多。

Nomono 的对话增强算法基于大型语音记录数据集——有些清晰易懂，有些则不太清晰——它们教会 AI 工具如何生成更好的声音。“播客不应该需要高级音频知识来制作高质量的音频，”Chourdakis 说。“通过自动化其中一些任务，他们可以花更多时间专注于精彩的故事讲述，而减少繁琐的清理任务。”

在未来，它们可以更轻松地发展，以创造一种新的沉浸式空间播客类型。例如，Nomono 的技术支持基于对象的音频制作，它允许制作人将声音“放置”在 3D 音景中或创建可以为听众量身定制的动态版本。

“媒体制作现在进入了一个阶段，如果你能梦想它，它就会发生，”Descript 的 LeBoeuf 说。“而且您不再需要拥有昂贵的工作室或数十年的培训来实现您的目标。”

资讯详情

播客的未来是人工智能

注意交通可达性差距：设计可达性优先的交通系统

数字孪生即将到来

相关资讯