Sora (人工智能模型)

Sora是一个能以文本描述生成视频的人工智能模型,由美国人工智能研究机构OpenAI开发。[1]

Sora
Sora生成的女子在东京街道上行走的视频
開發者OpenAI
首次发布2024年2月15日2024-02-15
平台OpenAI
网站openai.com/sora 编辑维基数据

Sora这一名称源于日文“空”( sora),即天空之意,以示其无限的创造潜力。[1]其背后的技术是在OpenAI的文本到图像生成模型DALL-E基础上开发而成的。[2]模型的训练数据既包含公开可用的视频,也包括了专为训练目的而获授权的版权视频,但OpenAI没有公开训练数据的具体数量与确切来源。[1]

OpenAI于2024年2月15日向公众展示了由Sora生成的多个高清视频,称该模型能够生成长达一分钟的视频。[2]同时,OpenAI也承认了该技术的一些缺点,包括在模拟复杂物理现象方面的困难。[3]麻省理工科技评论》的报道称演示视频令人印象深刻,但指出它们可能是经精心挑选的,并不一定能代表Sora生成视频的普遍水准。[2]

由于担心Sora可能被滥用,OpenAI表示目前没有计划向公众发布该模型,而是给予小部分研究人员有限的访问权限,以理解模型的潜在危害。[1][2]Sora生成的视频带有C2PA元数据标签,以表示它们是由人工智能模型生成的。[1]OpenAI还与一小群创意专业人士分享了Sora,以获取对其实用性的反馈。[1]

参见


参考文献

  1. Cade Metz. . The New York Times. 2024-02-15.
  2. Will Douglas Heaven. . MIT Technology Review. 2024-02-15.
  3. Antonio Pequeño IV. . Forbes. 2024-02-15.

外部链接

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.