Dolphin多语言ASR模型:支持40种东方语言与22种中文方言的语音识别解决方案

7小时前 高效码农

Dolphin:突破性多语言语音识别模型的技术解析与应用指南 Dolphin多任务数据格式示意图 核心优势与技术亮点 覆盖全球语言版图 由Dataocean AI与清华大学联合研发的Dolphin模型 …

CogAgent-9B-20241220技术解析:视觉语言模型驱动的GUI智能体新突破

3天前 高效码农

AutoGLM沉思与CogAgent-9B:智谱AI的浏览器Agent技术解析 CogAgent流程图 一、AutoGLM沉思:浏览器Agent的新范式 作为国内最早布局浏览器Agents的科技公司, …

字节跳动InfiniteYou:灵活重构照片同时保留身份特征的最新技术解析

7天前 高效码农

一、什么是InfiniteYou? InfiniteYou(InfU)是由字节跳动智能创作团队开发的一项突破性技术,旨在解决身份保留图像生成中的三大核心挑战:身份相似度不足、文本-图像对齐效果差,以及 …