【聊聊Sora】第一期：Sora硬核技术解读，欢迎来到AI生成的世界！-【聊聊Sora】第一期：Sora硬核技术解读，欢迎来到AI生成的世界！-爱哔哩(B站视频、音频mp3解析下载站)

【聊聊Sora】第一期：Sora硬核技术解读，欢迎来到AI生成的世界！-【聊聊Sora】第一期：Sora硬核技术解读，欢迎来到AI生成的世界！

视频图片作者头像弹幕高清视频下载(免费，不支持有版权的视频下载) 国内可用GPT（支持GPT4O、图文上传）

AID:

CID:

视频图片:

作者头像:

弹幕地址:

视频描述:

热门回复：

Dubai终于有硬币改名了:视频简介: Datawhale【聊聊Sora】第一期：欢迎来到AI生成的世界我们邀请了袁超逸|某大厂NLP算法工程师成晨|魔搭社区技术运营负责人叶娇娇|之江实验室高级研究专员李孝杰|HuggingSD负责人杨知铮|厦门大学平潭研究院研究员来为大家细致的聊聊Sora背后的故事，话题、干货很多，大家没有时间的话也可以直接选择自己感兴趣的部分听~ Datawhale - AI视频生成学习文档：链接见视频简介
AI视频小助理:一、SOLA等人工智能技术的相关内容，包括生成式人工智能、快速从研究领域向大众领域扩散、通用人工智能未来可期等。 00:17 - AI生成技术快速向大众领域扩散，如open i、solo等产品的发布 01:03 - 提供基础的文档和技术报告，帮助大家了解塑料的本质和时代趋势 03:37 - 提供AI视频生成学习教程，动手实践建立工作流，优化工作流程二、一种新的数据格式，它借鉴了VT中的patch和CHEGBT中的token，能够统一不同大小格式的视频和图像数据，具有很好的扩展性和匹配性。此外，它还不需要统一输入尺寸和进行数据增强，可以与世界进行互动，具有AGI的潜力。 08:22 - VT中的patch数据格式被借鉴用于统一视频和图像数据格式 09:20 - Patch的组合可以匹配不同形状的视频，无需统一输入尺寸 13:04 - Patch的特征包括3D建模、长视频生成和与世界互动的能力三、SORA模型在视频生成方面的应用和潜力，以及CV大一统的可能性。此外，我们还讨论了Patch的概念和模型参数量的估计。 16:41 - SORA通过经验学习物体特性，非理论学习 17:41 - CV大一统可能性增强，影响2D/3D任务 20:57 - 模型大小估计在30B左右，但信息量太少，难以准确估算四、OpenAI在视频生成任务中的技术方案，包括使用自回归的方式进行训练和预测，以及使用patch作为基本单元进行生成。同时，视频生成任务与传统的ALP也有很大的区别。 25:00 - SORA使用自回归方式进行视频生成 25:50 - 使用patch作为最小单元，记录时间和序列信息，进行预测和生成 28:47 - 使用生成关键帧再插帧的技术方案，但目前还未确认是否使用五、一个视频生成模型的训练方式和数据配比，包括视频切片、压缩、token数计算等。同时，它还使用了视频和图片混合的训练方式以及文对的标注。 33:20 - 视频数据token非常高，训练数据需要切成一分钟以内的视频来降低计算复杂度 36:08 - 可能使用了高质量的图片来扩充数据集，并混合视频和图片进行训练 --本内容由AI视频小助理生成，关注解锁AI助理，由@小菜鸡沐林风召唤发送
小菜鸡沐林风:@AI视频小助理总结一下
路過的管理员:[支持]
梦穸风呓:最硬核的 Sora 解读[打call]