5月13日,在 FORCE LINK AI 立异巡展·上海站,火山引擎发布豆包·视频生成模型 Seedance 1.0 lite、豆包1.5·视觉深度考虑模型,并晋级豆包·音乐模型,以更全面的模型矩阵、更丰厚的智能体东西,协助企业打通从事务到智能体的运用链路。
豆包·视频生成模型Seedance 1.0 lite:作用好、生成快、更廉价
此次全新发布的豆包视频生成模型Seedance 1.0 lite,支撑文生视频、图生视频,视频生成时长支撑5s、10s,分辨率供给480P、720P。企业用户可在火山方舟渠道运用该模型API,个人用户也可在豆包APP、即梦体会。
作为豆包视频生成模型系列的小参数量版别,Seedance 1.0 lite模型完结了两大打破:影视级的视频生成质量、视频生成速度大幅提高,统筹作用、速度、性价比。
更精准的指令遵从:经过强壮的语义了解,可精密操控人物表面气质、穿着风格、表情动作等,并在多主体动作解析、嵌入式文本呼应、程度副词和镜头切换呼应方面具有优势。
更丰厚的影视级运镜:支撑360度盘绕、航拍、变焦、平移、跟从、手持等多种镜头言语,具有细腻高清的根底画质和影视级美感。
更合理的运动交互:剖析动作时序与空间联系,提高人物、物体间天然流通的交互动作,运动轨道、受力反应愈加符合实际规则。
Seedance 1.0 lite模型可广泛运用于电商广告、文娱特效、影视创造、动态壁纸等场景。例如在电商范畴,可协助商家快速生成高质量的营销视频资料,精准匹配产品展现、活动推行等场景,下降制造本钱与周期。
豆包1.5·视觉深度考虑模型,在60项揭露评测中获得38项榜首
新发布的豆包1.5·视觉深度考虑模型(Doubao-1.5-thinking-vision-pro),激活参数仅20B,但具有强壮的多模态了解和推理才能,在60个揭露评测基准中,有38个获得 SOTA 体现,在视频了解、视觉推理、GUI Agent才能等方面均处于榜首队伍。现在,该模型已在火山方舟上线。
在视频了解方面,支撑动态帧率采样,视频时序定位才能明显增强,结合向量查找,可精准定位视频中与文本描绘相对应的片段。
[第18支-找钥匙 v2-0509.mp4]
视频时序定位:精确定位钥匙方位和钥匙找到的时刻
一起,新增视频深度考虑才能。模型学习了数万亿多模态符号数据,把握广泛视觉常识,结合强化学习,使视觉推理才能大幅提高。例如,在杂乱的图形推理题中,模型提出假定,进行推理查验,当发现和假定不一样时,还能进行不断反思,提出新的猜想,直到得出正确答案。
[图片demo三合一-0509.mp4]
杂乱视觉推理:图形推了解题、解析元素相关、视觉精准定位
此外,该模型新增GUI Agent才能。根据强壮的GUI定位功用,可在PC端、手机端等不同环境中完结杂乱交互使命。例如,可对新开发的APP功用进行自动化检测,现在该功用现已运用于字节跳动多款APP产品的开发测验中。
[自动化检测.mp4]
多模态智能体:检测APP中朋友Tab点赞功用
上一年火山引擎推出了豆包·音乐模型,用户仅经过一张图、一句话就不能自制创造10多种不同风格的高品质音乐。此次大会上,豆包·音乐模型晋级,不只支撑英文歌曲创造,还不能自制经过了解视频,自动适配纯音乐BGM。现在豆包·音乐模型已全量上线,个人和企业用户可在海绵音乐、火山引擎官网体会。
[豆包音乐-标准版.mp4]
Data Agent及新版Trae露脸上海巡展
Data Agent是火山引擎推出的企业数据全场景智能体,具有自动考虑、洞悉、剖析、举动才能,不能自制协助企业发掘数据财物价值,功用掩盖数据剖析、智能营销等要害范畴。
在数据剖析上,Data Agent能交融企业界结构化与非结构化数据,结合联网常识,精准了解事务需求,快速生成专业深度研究陈述。经过自动化拟定剖析计划、追溯目标动摇、运用自助剖析东西及建立预警体系,完结数据处理全流程智能化,将杂乱报表生成的时刻从 2 天缩短至 30 分钟,明显提高数据获取与决议计划功率。
在智能营销范畴,Data Agent 完结从战略拟定到履行优化的全链路闭环办理,高效完结人群圈选与战略拆解,根据个性化引擎完结精准营销。此外,其智能会话辅佐与自动复盘优化功用,可不断提高转化率与客户满意度,动态迭代营销战略。
此外,为协助开发者更快捷地使用AI提高开发功率,国内首款 AI 原生 IDE 产品Trae也带来多个要点功用晋级,例如一致的AI对话面板(一切交互仅需一个对话框)、支撑自界说 @Agent(构建你的专属 AI 团队)、新增联网查找 #Web 和文档 #Doc 的上下文了解类型(AI 履行需求更精确高效)、经过MCP让AI自动调用外部东西等。
现在,Trae已装备豆包1.5·深度考虑模型(Doubao-1.5-thinking-pro),根据模型自动深度考虑和20毫秒极低推迟,让代码生成的质量更好、功率更高。
豆包大模型工业落地加快,为职业智能化提效
现在,豆包大模型已在轿车、智能终端、互联网、金融、教育科研、零售消费等职业广泛落地,掩盖4亿终端设备、多半干流车企、70%体系重要性银行和数十家证券基金公司、近七成的 C9尖端高校和100多家科研院所。
在游戏职业,伟人网络正在凭借大模型才能重塑游戏体会和玩法立异。经过火山方舟接入豆包大模型及 DeepSeek,伟人网络已在旗下《太空杀》中推出Al原生游戏玩法“内鬼应战”,根据大模型深度考虑等才能打造Al玩家,与实在玩家进行实时战略对立,从头界说了交际推理游戏的智能鸿沟。
一起,《原始征程》也接入大模型才能打造AI 智能NPC“小师妹”,在游戏战略教导、情感陪同等方面供给更智能、更人性化的交互体会,明显提高了玩家粘性。
此外,凭借火山引擎机器学习渠道所供给的大模型练习及资源保证,伟人网络亦推进了自研大模型的迭代优化。
在医疗职业,礼来制药建立了专属 AI 运用开发渠道,支撑从药物研发到疾病治疗的全场景立异。经过可视化工作流编列,礼来制药建立了HCP Chatbot, 区域司理教导陈述等智能体,在学术交流、出售训练、疾病教育等多个场景中构成运用,完结了企业 AI 财物的沉积与继续化运营。