这两天,豆包字节又出手了 ,模型一口气放出一堆大货 。上新
豆包大模型1.6 、字节豆包·视频生成模型 Seedance 1.0 pro、持续豆包·语音播客模型,卷性价比豆包·实时语音模型...全家桶式上新,豆包看着热烈。模型
假如你仅仅扫一眼上述产品,上新或许觉得便是字节大厂又来了一波例行晋级 ,没什么特其他。持续现在AI圈更新节奏这么快,卷性价比新模型 、豆包版别号、模型榜单名次一大堆 ,上新的确不太简单提起爱好。
但略微往下看一看 ,会发现这次字节的做法不太相同 。它并没有靠一两个参数或许演示视频来抢风头,而是开端把模型才能做成一整套“能直接跑起来”的运用 ,从文字、图画 、视频,到语音、操作体系,全都串在了一同 ,并且不少是直接挂进了豆包APP、火山方舟这些现已在用的产品里。
咱们就从两个中心产品说起 。
Seedance 1.0 Pro 实测体现 :
安稳 、成型,但仍有鸿沟。
假如只看热度 ,这几个产品中 。Seedance应该是被重视度最高的了。
它刚上线就登上了第三方榜单Artificial Analysis的文生视频和图生视频两项榜首 ,超过了可灵2.0和谷歌的Veo 3。榜单怎样评的咱们能够再评论,但至少阐明在业内规范下 ,Seedance的生成作用现已达到了干流模型中的较好水平 。
咱们来看下这个模型的根本情况。
Seedance 1.0 Pro支撑文字和图片输入,能生成10秒左右的1080p视频,支撑2-3个镜头切换。它的首要特点,是着重镜头之间的连贯性和内容的安稳性 。
这点在之前的视频生成模型里,的确是个短板 。许多模型尽管能出图画 ,但内容连不起来 ,主角忽然消失或许布景颤动都很常见 。
Seedance处理这个问题的方法,是把每个镜头的内容用文字描绘得更细 ,官方叫「精准描绘模型」。它先生成一段描绘,然后再依据这个描绘练习视频。这种方法能让模型更好地知道该生成什么内容,也更简单操控住动作和细节 。
Seedance能生成的视频风格也比较多样,能够支撑航拍、榜首人称