共绘网,新闻,热点话题,最新热点资讯,今日热点,热点新闻,一周新闻热点,热点新闻事件,热点评论

手机版
手机扫描二维码访问

文生视频模型Sora的出世及升级版,预示着动画动漫、影视和新闻主播等行业面临前所未有的挑战?

发布日期:2024-03-16    浏览次数:4149

  

       一位时尚的女士走在东京的街道上,街道上充满了温暖的霓虹灯和生动的城市标志。她穿着黑色皮夹克、红色长裙和黑色靴子手里拿着一个黑色钱包。她戴着太阳镜和红色口红。她走路自信而随意。街道潮湿且反光,形成了彩色灯光的镜面效果。许多行人走来走去。

        也许光听这样的描述,你的脑海中已经浮现出了一位都市丽人,她自信洒脱,吸引着来来往往所有人的目光。其实,她叫Sora,是一种利用文本生成视频的AI模型。除了从文本到视频,Sora还可以使用其他输入格式进行提示,比如图像,或视频。毫无疑问,Sora视频生成模型的发布,让我们再次见证了科技创新对文明的深远影响,它不仅推动了视频制造领域的技术飞跃,也预示了信息传播方式的革新,加速了文明的发展。

  

        互联网时代,短视频时代科技为王的时代,共绘网有理由相信,文生视频模型Sora的出世及升级版,预示着动画动漫、影视、新闻主播和广告等行业面临前所未有的挑战,也就是说未来各式各样的网络数字人将代替真人表演或直播甚至演讲,与此有关的人员会面临失业......科技创新是人类文明的进步,也对人类的未来提出了新的挑战。对此,您有什么想说的呢?“愿中国青年都摆脱冷气,只是向上走。有一份光,发一份热。就令萤火一般,也可以在黑暗里发一点光。不必等候炬火!”尽自己的一份力、发出自己的一点声音。

相关热词搜索:视频模型 Sora 动画动漫 影视 新闻主播
赞同(28)  |  中立(0)  |  反对(0)  |  收藏

 赞同    中立    反对   登录 | 注册   需要登录才可发布评论

  • 赞同评论
  • 中立评论
  • 反对评论

一共有人参与  条评论

上进的饺子2025-01-21

数据收集和训练(Data Collection and Training)对于仿真到现实适应性,高质量数据非常重要。传统的数据收集方法涉及昂贵的设备、精确的操作,并且耗时、劳动密集,通常缺乏灵活性。最近,一些高效且成本效益高的方法被提出用于高质量演示数据收集和训练。本节将讨论真实世界和模拟环境中数据收集的各种方法。图16展示了真实世界和模拟环境中的演示数据。真实世界数据(Real-World Data):在大量、丰富的数据集上训练大型、高容量模型已经显示出显著的能力和显著的成功,有效地解决了下游应用问题。例如,像ChatGPT、GPT-4和LLaMA这样的LLMs不仅在NLP领域表现出色,而且为下游任务提供了出色的解决问题能力。因此,是否有可能在机器人领域训练一个具身大型模型,通过训练拥有强大的泛化能力,并能够适应新场景和机器人任务。这需要大量的具身数据集为模型训练提供数据。Open X-Embodiment[303]是一个来自22种不同机器人的具身数据集,包含527种技能和160,266个任务。收集的数据由机器人执行操作的真实演示数据组成。该数据集主要关注家庭和厨房环境,涉及家具、食物和餐具等物品。操作主要围绕拿起放置任务,一小部分涉及更复杂的操作。在这个数据集上训练的高容量模型RT-X展示了出色的迁移能力。UMI[358]提出了一个数据收集和策略学习框架。他们设计了一个手持夹持器和优雅的界面进行数据收集,实现了便携、低成本、信息丰富的数据收集,用于挑战性的双手和动态演示数据。通过简单地修改训练数据,机器人可以实现零样本泛化的双手、精确任务。Mobile ALOHA[359]是一个低成本的全身移动操作系统。它可以用于收集全身移动下的双手操作任务数据,如炒虾和上菜。使用这个系统和静态ALOHA收集的数据训练代理可以提高移动操作任务的性能。这样的代理可以作为家庭助手或工作助手。在人类-代理协作[360]中,人类和代理在数据收集过程中一起学习,减少人类工作量,加快数据采集速度,提高数据质量。具体来说,在具身场景中,在数据收集期间,人类提供初始动作输入。随后,代理通过迭代微调和去噪过程优化这些动作,逐步产生精确、高质量的操作演示。整个过程可以总结如下:人类在操作中贡献直觉和多样性,而代理处理优化和稳定性,减少对操作员的依赖,使执行更复杂的任务,收集更高质量的数据。模拟数据(Simulated Data):前述的数据收集方法涉及直接在真实世界中收集演示数据以训练代理。这种收集方法通常需要大量的人力、物力资源和时间,导致效率低下。因此,在大多数情况下,研究人员可以选择在模拟环境中收集数据集进行模型训练。在模拟环境中收集数据不需要大量资源,通常可以由程序自动化,节省大量时间。CLIPORT[294]和Transporter Networks[361]从Pybullet模拟器收集演示数据,用于端到端网络模型训练,并成功地将模型从模拟转移到真实世界。GAPartNet[362]构建了一个以零件为中心的大规模交互数据集GAPartNet,为感知和交互任务提供了丰富的零件级注释。他们提出了一个用于领域泛化的3D零件分割和姿态估计的流程,可以很好地泛化到模拟器和真实世界中未见过的物体类别。作者:张长旺

(0)

阿芹2024-12-06

大网红你真了不起#微信视频号#短视频知识#短视频干货#自媒体#短视频 谢谢、关注。[合十][合十][合十][合十][合十] 时刻开心

(0)

童静2024-07-04

当前,人工智能正尝试代替人进行“艺术创作”,对于接受人工智能“作者”及其作品,我们是否有充分的心理准备?更进一步,我们是否有充分的心理准备接受人类作者“完全”被机器所替代?在中文世界中,2017年5月,微软“小冰”的原创诗集《阳光失了玻璃窗》正式出版,这是人类史上第一部完全由人工智能程序创作的诗集。 同年,清华大学“九歌”(THUAIPoet)诞生,它是中文古体诗歌生成系统。对于“小冰”创作的诗集和“九歌”所作的古体诗歌,一般的读者难以区分它们是机器所作还是人类所作。“小冰”和“九歌”在专业领域里的表现可以认为通过了图灵测试,它们具有了“专门智能”。不仅如此,“小冰”和“九歌”的创作速度大大超过人类,且它们能够被改进以自我进化。人工智能创作者的出现表明“作者之死”——人类或将不再是文学作品的创作者。对于人类,“写作是为了成就一个不同的自己,探索不同的书写方式,乃是对自我之生成的最好捍卫。……人工智能作为人之智能的分裂和对立,也许恰恰督促了重新反思人之为人或主体之为主体的根本所在。”但是,人工智能正挑战人类作为意义构建者即作者的地位,沿着这样的发展趋势,人工智能将会发展成意义的构建者,而人将只是作为读者而存在。人是意义的消费者,而意义的主人是人工智能。这样的状况恐怕是人类难以接受的。来源 | 《学术前沿》杂志及人民论坛网

(1)

王惠清2024-06-28

承蒙朋友厚爱。祝愿朋友,心想事成,梦想成真。[强][强][强][强][强][强][强][强][强][强][强][强][强][强][强][强][强][强][强][强][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][爱心][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰]

(0)

慧新2024-06-23

谢谢[合十] [合十][合十][合十][合十][合十][合十][爱心][爱心] 朋友,你好,祝你一切顺利,谢谢你了。祝你一切顺利!

(0)

慧慧2024-06-17

顶级文案[强] 视频做得太好了[强][强][强] 和谐,共赢

(0)

红双喜2024-06-03

[666][666][666][666][666][666][弱][玫瑰][玫瑰][玫瑰][玫瑰][玫瑰][爱心][爱心][凋谢][凋谢][凋谢][凋谢][666][666][666][666][666][弱]

(0)

魏慧波2024-05-16

人工智能大模型领域,中国人终于有了自己的sora! 4月27日,在中关村论坛未来人工智能先锋论坛上,生数科技联合清华大学正式发布了中国首个长时长、高一致性、高动态性视频大模型Vidu。这是自Sora发布之后全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平。 团队自研的架构U-ViT。 据介绍,Vidu采用研发团队原创的架构U-ViT,由团队于2022年9月提出,早于Sora采用的DiT架构,是全球首个Diffusion(扩散概率模型)与Transformer融合的架构,完全由团队自主研发。 根据生数科技的官方介绍, Vidu 模型之所以取得快速突破,源自于该团队在贝叶斯机器学习和多模态大模型的长期积累和多项原创性成果。 早在 2022 年 9 月,出于对标当时刚刚开源的 Stable Diffusion, 清华团队提交了一篇名为 《All are Worth Words: A ViT Backbone for Diffusion Models》的论文,里面提出了全球首个 Diffusion 与 Transformer 融合的架构,比 Sora 采用的 DiT 架构还要再早两个月。 到了去年 3 月,团队开源了全球首个基于 U-ViT 融合架构的多模态扩散模型 UniDiffuser,率先完成了 U-ViT 架构的大规模可扩展性验证,一举实现了从简单的文生图扩展到图生文,图文改写等多种功能。 正是基于对 U-ViT 架构的深入理解以及长期积累的工程与数据经验,团队才能在短短两个月里进一步突破了长视频表示与处理的多项关键技术,成功研发出 Vidu 视频大模型。 国产“sora”。 据朱军介绍,目前国内已有视频大模型的生成视频大多在4秒左右,而vidu支持一键生成长达16秒、分辨率高达1080P的高清视频内容,不仅能模拟真实物理世界,还拥有丰富想象力,具备多镜头生成、时空一致性高等特点。与Sora一致,Vidu能根据文本描述直接生成长达16秒的高质量视频。 值得一提的是,Vidu是自Sora发布之后,全球率先取得重大突破的视频大模型,性能全面对标国际顶尖水平,并在加速迭代提升中,完全有能力与Sora抗衡。娟子

(0)

听浪声2024-04-26

[呲牙][呲牙][呲牙] 人间真情 主播有才[强][强][强]

(0)

融通2024-04-24

格局越大,越懂得成全。 孔子曰:君子成人之美,不成人之恶。 真正有大格局的人,懂得相互帮衬,主动善待他人。 格局越大,越懂得成全。 上个世纪40年代,戏曲家程砚秋先生曾拜梅兰芳先生为师。 两人本是同行竞争,梅兰芳却对程砚秋倾囊相授。 梅兰芳会主动询问程砚秋演什么节目,若发现节目相同,他就主动更改,绝不与程砚秋的重复,以免影响程砚秋的观众数目。 另外,在演出票价上,他也故意不超过程砚秋,以此表明程砚秋的价值和地位。 在梅兰芳的扶持下,程砚秋也成为一代京剧大师,两人亦师亦友,共同推动了戏曲艺术的发展。 《幽梦影》中说:云映日而成霞,泉挂岩而成瀑。 没有太阳照耀,云便无法变成绚烂彩霞;没有山崖托举,泉水便难以成为壮丽的瀑布。 一个人能力再强,若是嫉贤妒能,以至无人帮扶,未来的路只会越走越窄。 人与人之间,是一场相互成全,只有互相帮助,才能彼此成就。人民论坛网

(1)
1 2 18条信息

会员登录

×

会员注册

×