什么是 Sora AI？ OpenAI 全新的人工智能视频生成器

Mitu333 · Post by **Mitu333** » Tue Dec 03, 2024 9:40 am

当生成式人工智能首次引起轰动时，人们犹豫不决，不知道该怎么想。它会抢走创意专业人士的工作吗？它到底能变得多聪明？我们注定要失败吗？

以极快的速度生成文本令人印象深刻，图像更是如此。但是视频呢？那会很不可思议，对吧？好吧，那个时候已经到了。文本到卢森堡电子邮件列表 206480 联系人线索视频模型比以往任何时候都更加强大，如果它们继续保持目前的轨迹，将对整个行业产生巨大影响。

OpenAI 为文本转视频领域做出的贡献 Sora AI 尚未发布，但该工具的预告片非常吸引人。让我们来探索一下 Sora AI 到底是什么——它能做什么和不能做什么，以及文本转视频如何影响我们所知的营销。

什么是 Sora AI？
Sora AI是一种功能强大的文本转视频生成 AI 模型，由 OpenAI 开发，该团队也是现在无处不在的基于文本的 ChatGPT 模型的幕后推手。

简单来说，Sora 可以根据文本指令创建逼真且富有想象力的视频场景（最长可达一分钟），模拟运动中的物理世界。你知道 ChatGPT 如何编写或告诉你你要求它做的事情吗？Sora 对视频做了同样的事情。这有点疯狂。

虽然它目前还不能供公众使用——因为 OpenAI 继续与政策制定者和艺术家合作——但看起来我们距离公开发布并不遥远。

文本转视频模型如何工作？
我甚至不会假装了解这些日益先进的人工智能模型是如何实现其目的的。数据、数字、算法......魔法？也许是这些东西的结合？这些文本到视频工具背后的技术——称为去噪潜在扩散模型——当然我不明白，但幸运的是，人工智能足够聪明，可以帮助我们用简单的术语描述它的工作原理（当然，经过仔细检查和交叉引用）：

噪声初始化：该过程从随机噪声场开始，该噪声场本质上是一堆散布的、无人关心的像素。
扩散过程：这涉及以受控方式向图像添加噪声。模型学习根据当前图像和期望输出预测每一步应添加的噪声。
去噪：添加噪声后，模型对图像进行去噪，去除噪声并使其更接近所需的输出。
迭代：这个过程重复多次，模型逐渐细化图像，直到与文本指令紧密匹配。