沃卡惠移动端logo

沃卡惠  行业资讯

资讯详情

播客的未来是人工智能

2022-11-07 09:16:224636

粗略地说,一个月内推出了大约 22,000 个新播客。根据Podcast Industry Insights的数据,Apple Podcasts 目录中目前有近 250 万(超过 7100 万集)。这些只是我们所知道的。

“现在很多播客甚至都没有通过大平台。他们直接面向听众,销售优质内容并取得了巨大的成功,”英国广播公司电台前任工作人员、卡迪夫研发咨询公司Bwlb的创始人安迪·泰勒说。

更不用说越来越多的类似播客的内容,无论是由品牌为促销或活动制作人创建的,例如,想要按需提供谈话。每一条内容都需要制作和分发,无论是由音频专业人士还是学习手艺的人。因此,他们越能自动化大量生产,就越能专注于内容。

“音频发布的不同地方刚刚爆炸式增长,”M Works Mastering的首席工程师和波士顿伯克利音乐学院的教授Jonathan Wyner 解释道“在所有这些背景下,创作者有真正的动机和必要性来变得更加多才多艺。”

更不用说,更有生产力和效率。

播客的未来是<a href=https://www.wokahui.cn/ai/ target=_blank class=infotextkey>人工智能</a>

人工智能的兴起

人工智能(AI)——可以自动化以前由人类完成的任务的软件——是处理播客内容海啸的关键。AI 不仅可以加快制作速度,还可以让播客听起来更好,并为明天的音频体验奠定基础。

“人工智能基本上有助于处理重复性任务,以加快播客的工作流程,”开发基于人工智能的播客工具的Nomono研究工程师 Manos Chourdakis 解释道。“例如,有了人工智能,你不必听整个播客就可以找到有人说错了什么,然后替换或删除它。你可以自己做,但人工智能做得更快。”

还有一些只能用人工智能完成的家务——至少在规模上是这样,比如消除噪音或增强对话。“如果没有人工智能,高质量的对话增强是不可能的,”Chourdakis 说。“至少在合理的时间范围内使用传统工具是不可能的。”

非常适合琐碎的任务

人工智能在播客中的应用与生产任务一样多种多样。有些直接内置到播客平台中。当创作者将他们的播客上传到托管平台Podcast.co时,系统会自动“收听”音频文件并标准化音量。

“任何可以帮助减少工作中令人麻木的工具都是一件好事,”该平台的联合创始人 Mike Cunsolo 说。Cunsolo 还经营着与企业品牌合作的播客制作公司Cue和将播客制作人与客人联系起来的Matchmaker.fm 。“你总是需要人类的专业知识元素,但很快机器就可以学会理解是什么让播客变得有趣,并减少了完成任务的时间。”

解决方案提供商Descript将 AI 应用于播客工程的许多方面,包括去噪和回声控制。Descript 可以处理的更“令人麻木”的家务之一是房间音调。

“有时制作人需要在播客中插入数字静音。可能是在编辑之间,或者是为了拉长句子之间的间距,”Descript 的业务和企业发展主管 Jay LeBoeuf 说。“但这听起来非常不自然。”

如果制作人在录制播客时没有捕捉到房间音调,他们可能不得不回去获取它。或者他们可以在录音中聆听,在需要的地方复制粘贴,然后编辑结果使其自然融合。

或者计算机可以处理它。Descript 基于 AI 的房间音生成器分析录音,识别房间音,并在需要的地方自动合成。这种技术不仅避免了繁琐的任务,还提供了更大的生产灵活性。

Nomono 的 Chourdakis 说:“人工智能将允许我们使用更便宜的硬件、更差的房间和更嘈杂的位置,并且仍然可以获得良好的结果。”

新的基于人工智能的能力

人工智能还为播客创新打开了大门——创造新的解决方案,提高播客和听众的标准。例如,流行音频参考 (EAR) 工具可帮助播客根据他们喜欢的歌曲找到无版权的音乐。

“假设您正在寻找前奏或结尾音乐,并且您正在考虑一首特定的歌曲,但它受版权保护,”Chourdakis 说。“该系统在后台使用 AI 来帮助您找到类似的东西。”

在 Bwlb,Taylor 的团队开发了Accordion,这是一种基于 AI 的解决方案,可以接收播客并以各种长度进行复制。

“我们生活的每一部分都变得越来越智能——智能家居、智能冰箱,”泰勒说。“人们也希望从播客体验中获得更多控制和便利。”

当泰勒为 BBC 制作纪录片时,他会被要求提供更短的版本以在不同的平台上运行。该过程始终是手动的。Accordion 将软件算法应用于播客内容,以智能地创建不同长度的版本。“它不会加快任何速度,”Taylor 说,“但它让用户可以控制内容的持续时间,而不会失去音调结构或可听性。”

专注于沉浸式讲故事

播客使用人工智能工具越多,他们就会变得越好。换句话说,他们摄取的数据越多,他们学到的就越多。

Nomono 的对话增强算法基于大型语音记录数据集——有些清晰易懂,有些则不太清晰——它们教会 AI 工具如何生成更好的声音。“播客不应该需要高级音频知识来制作高质量的音频,”Chourdakis 说。“通过自动化其中一些任务,他们可以花更多时间专注于精彩的故事讲述,而减少繁琐的清理任务。”

在未来,它们可以更轻松地发展,以创造一种新的沉浸式空间播客类型。例如,Nomono 的技术支持基于对象的音频制作,它允许制作人将声音“放置”在 3D 音景中或创建可以为听众量身定制的动态版本。

“媒体制作现在进入了一个阶段,如果你能梦想它,它就会发生,”Descript 的 LeBoeuf 说。“而且您不再需要拥有昂贵的工作室或数十年的培训来实现您的目标。”