一句话让马斯克“上天”变成3D动画!这家文生视频AI公司火出圈
2023-12-01 10:56:20 作者: 来源:证券时报网 浏览次数:0 网友评论 0 条
中华PE:
AI视频创业领域,迎来了一个令人惊艳的玩家。11月29日,美国AI初创公司Pika labs发布了第一个产品Pika 1.0。这个产品能够生成和编辑3D动画、动漫、卡通和电影,其官方发布的视频因令人惊艳的效果而火出圈,极大拓展了投资圈对AI视频创业领域的想象空间。据了解,Pika labs已经获得5500万美元融资。据福布斯报道,Pika labs估值目前在2亿至3亿美元之间。
一句话生成马斯克3D动画,颠覆传统视频制作
让Pika 1.0在全网火出圈的是一段让马斯克“上天”的视频。官方宣传视频上,只需要输入“马斯克穿着太空服,3D动画”,一个动画版本、穿着太空服准备乘坐火箭上太空的马斯克即可生成,外形、动作、背景等元素均十分逼真,可以媲美花大成本制作的3D动画影像。
除了生成视频,Pika 1.0还可以实现对现有视频素材中的元素进行修改、更替。例如,更改视频人物的衣着、为视频中的“猩猩”戴上墨镜、转化视频的风格等等。只需要在视频编辑器中写下提示词,即可生产高质量的视频,或者对视频元素进行编辑和修改。这些能力颠覆了传统视频制作,让“每一个普通人都能成为电影导演”变成现实。
总体来看,Pika 1.0的新功能主要有以下几个方面:一是用文本和图像生成视频,只需要输入几行文本或上传图像,就可以创建简短、高质量的视频;二是编辑更改视频,输入相关文本,实现对背景环境、衣着道具等元素的增减或者更改;三是切换视频风格,例如在黑白、动画等不同风格中转化;四是更改视频的宽高比。
目前,Pika 1.0已经开启了申请试用。公司也表示,正在努力修改算法进一步改进模型,并开发用于过滤受版权保护材料的模型。
斯坦福女博士退学创业,获多名AI资深投资人看好
Pika labs成立于今年4月,团队目前仅有4名全职成员。其中,创始人兼首席执行官Demi Guo和联合创始人兼首席技术官Chenlin Meng均为斯坦福高材生。
根据公开资料,Demi Guo在哈佛大学获得数学学士学位,同时攻读了计算机科学硕士学位,并转至斯坦福大学攻读博士学位,进行图形学和神经语言程序学交叉领域的研究,曾在微软、谷歌等公司实习,拥有很强的工程和科研能力。Chenlin Meng是斯坦福大学计算机科学博士生,本科期间就发表了5篇通用人工智能方向的论文,在生成式AI领域有很深的研究。
今年4月,两人双双从斯坦福大学退学创业,成立了Pika labs,想要打造一个更容易使用的人工智能视频生成器。Pika labs的官方博客上写道:“我们对 Pika 的愿景是让每个人都能成为自己故事的导演,并激发出我们每个人的创造力。”据了解,在过去的两个月里,Pika 的Discord服务器人数已增长到超过16万,用户数量已经达到50万左右,并且现在每周都有数百万新视频生成。
创始人超强的技术背景,也让这家仅仅成立6个月的初创公司获得了硅谷一众投资人的青睐。11月29日,Pika labs宣布完成 5500 万美元融资,并在官方社交网络上发文感谢合作伙伴,名单就囊括了很多AI领域的资深投资人。
其中,Nat Friedman为源代码在线托管平台Github的前首席执行官,Adam D'Angelo为知名问答网站Quora的创始人以及OpenAI的董事会成员,Clem Delange则为开源模型社区Hugging Face的创始人。
据媒体报道,获得了新的融资后,Pika labs计划将团队规模扩展到大约20人,招募更多的工程师和研究人员。目前Pika 1.0可供用户免费使用,Demi Guo也透露商业化目前还不是公司的优先事项。不过,未来公司可能会面向消费者推出分级订阅模式。
AI视频领域竞争日趋激烈,赋能短剧行业降本增效
随着Pika 1.0的发布,AI视频领域的竞争日趋白热化。最近一段时间,国内外AI公司均在密集发布新产品或更新产品的功能。
11月29日,AI视频领域的另一个初创企业Stability AI推出新的文生图模型SDXL Turbo。据了解,这一模型基于一种名为逆向扩散蒸馏(ADD)的新型蒸馏技术,可以将生成图像所需的步骤数从50步减少到1步,在保持高采样保真度的同时生成实时文本到图像输出。用户可访问Stability AI的图像编辑平台Clipdrop,观看SDXL Turbo的测试版演示,目前可免费试用。
前不久,Meta推出了两项基于人工智能的视频编辑新功能,可用于在社交媒体上发布视频,在文生图的技术基础上实现了文生视频。除此以外,AnimateDiff、GEN-2、Moonvalley、MAKEAVIDEO等开源免费软件也提供类似的功能。
除了国外公司,国内的百度、阿里巴巴、腾讯、360、昆仑万维等公司也纷纷加大对视频领域大模型的投入,并推出相关的AI模型。例如,今年6月,360智脑大模型4.0版本发布,具备文字、图像、语音和视频等跨模态处理和生成能力。据了解,其中的“文生视频”多模态功能为国内首发,任何文字脚本都可生成视频,不受专业技能和素材限制。
当前,短剧市场方兴未艾,正成为资本市场的新宠。业内人士分析,随着AI视频领域技术的不断成熟和应用,短剧制作的成本将有望大大降低。过去,短剧制作的大多数成本主要投入在聘用演员、服装租赁、场景构建、拍摄剪辑、特效制作等方面,随着AI技术的使用,以上的制作资金投入都将大幅减少。
国盛证券最近的一份研报指出,文生视频技术的日趋成熟和广泛应用,或将为当下热门的短剧市场带来变数。文生视频技术有望极大降低短剧制作的综合成本,为解决“重制作而轻创作”的共性问题提供解决方案,短剧制作的重心有望回归高质量剧本创作。