豆包大模型首次亮相
豆包大模型原名“云雀”,是国内首批通过算法备案的大模型之一。
发布会现场,字节跳动有关负责人介绍,豆包大模型提供的是一个有多模态能力的模型家族,目前主要包括通用模型pro、通用模型lite、语音识别模型、语音合成模型、文生图模型等9款模型:
豆包通用模型pro:字节跳动自研LLM模型专业版,支持 128k 长文本,全系列可精调,具备更强的理解、生成、逻辑等综合能力,适配问答、总结、创作、分类等丰富场景;豆包通用模型lite:字节跳动自研LLM模型轻量版,对比专业版提供更低 token 成本、更低延迟,为企业提供灵活经济的模型选择;
豆包·角色扮演模型:个性化的角色创作能力,更强的上下文感知和剧情推动能力,满足灵活的角色扮演需求;
豆包·语音合成模型:提供自然生动的语音合成能力,善于表达多种情绪,演绎多种场景;
豆包·声音复刻模型:5秒即可实现声音1:1克隆,对音色相似度和自然度进行高度还原,支持声音的跨语种迁移;
豆包·语音识别模型:更高的准确率及灵敏度,更低的语音识别延迟,支持多语种的正确识别;
豆包·文生图模型:更精准的文字理解能力,图文匹配更准确,画面效果更优美,擅长对中国文化元素的创作;
豆包·Function call模型:提供更加准确的功能识别和参数抽取能力,适合复杂工具调用的场景;
豆包·向量化模型:聚焦向量检索的使用场景,为 LLM 知识库提供核心理解能力,支持多语言。
强大性能与高效处理能力的结合
据火山引擎总裁谭待介绍,豆包大模型是一款基于深度学习的自然语言处理(NLP)和图像生成模型。
它拥有卓越的文本处理能力和图像生成技术,日均能够处理高达1200亿Tokens的文本数据,并生成超过3000万张高质量图片,展现了其强大的数据处理能力和丰富的应用潜力。
字节跳动内部50多个业务已经大量使用豆包大模型进行 AI 创新,包括抖音、头条等数亿 DAU 产品。
豆包大模型的技术创新在于其多模态能力和模型家族的构建。豆包大模型的应用场景广泛,从AI对话助手到AI应用开发平台,再到互动娱乐应用和AI创作工具,全系列可精调,具备强理解、生成、逻辑和记忆力,在问答、总结摘要、创作、文本分类、角色扮演等通用场景具备全面通用的能力,字节跳动通过这一模型提升了多个业务的效率和用户体验。
大模型价格进入“厘时代”
豆包大模型的另一大亮点在于其极具竞争力的定价策略。
谭待认为,降低成本是推动大模型快进到“价值创造阶段”的一个关键因素。
豆包大模型的定价大幅低于行业价格:以豆包通用模型pro-32k版为例,模型推理输入价格仅为0.0008元/千Tokens,换算成汉字,仅需0.8厘就能处理超过1500个汉字比行业便宜99.3%。
谭待表示,此外,128k的豆包通用模型也只需要0.005元/千Tokens,比行业价格低95.8%。作为对比,谭待在发布会上同时给出了GPT4、文心一言和通义千问等友商大模型的单价。
根据火山引擎公布的价格计算,1元钱就能买到豆包主力模型的125万Tokens,大约是200万个汉字,相当于三本《三国演义》。
对于定价,谭待表示,“主要有两个原因:第一点是我们能做到,第二点是我们需要这么做。”他介绍,火山引擎在技术上有非常多优化手段,可以降低大模型成本,此外在工程上可以通过分布式推理的形式将底层算力使用得更好;另外,在混合调度方面,可以把不同负载作为混合调度,这样的成本也大幅下降。
谭待坦言,大模型降价,不能只提供低价的轻量化版本,主力模型和最先进的模型也要够便宜,才能真正满足企业的复杂业务场景需求,充分验证大模型的应用价值,从而催化出超越现有产品和组织模式的创新。
数据显示,基于豆包大模型同名打造的豆包 APP,在苹果 APP Store 和各大安卓应用市场,豆包 APP 的下载量在AIGC类应用中排名第一*。豆包上已有超过 800 万个智能体被创建,月度活跃用户达到 2600 万。