Google DeepMind 在上周三(24 日)分享其视觉语言模型(visual language models, VLM)Flamingo 已应用於为 YouTube Shorts 生成影片的叙述,将有助於提高短影片被观众发现的可能性。

由於 YouTube Shorts 通常是创作者在较短时间内制作完成,常常未加入对影片的文字描述和标题,且使用者观看 Shorts 的习惯主要是一路向下滑动,而不是主动搜寻浏览,也降低了创作者加入描述标题等後设资料(metadata)的动机,这进而导致用户难以透过搜寻来找到 Shorts。

因此 Flamingo 通过分析影片的初始影格来生成描述,以解释影片的内容。这些文字描述会作为後设资料储存起来,以利日後 YouTube 能对影片进行更准确的分类,并将搜寻结果与观众的搜寻相互配对。

不过这些 AI 自动生成的描述,并不会出现在页面上显示给用户看,後设资料是处於幕後。Google 表示有了 AI 的加持後,观众能更轻易搜索 Shorts 内容,而创作者则能在不需有额外的操作下触及更多国际上的观众。

Flamingo 目前已开始将自动生成描述的功能应用於近期新上传的 Shorts。

至於日後会不会将自动生成影片描述的功能加入至 YouTube 长影片,Google 表示完全可以想像 Flamingo 也应用於长影片,但他们认为这样的需求可能较少。因为观众通常会根据标题和影片首图选择要观看的内容,创作者在制作影片时本就有动机增加有助於提高被搜索机率的後设资料。

资料来源:The Verge、Gearrice

责任编辑:Jocelyn
核稿编辑:Mia

0 0 投票数
Article Rating
订阅评论
提醒
guest
0 Comments
内联反馈
查看所有评论
0
希望看到您的想法,请您发表评论x