会写字、懂排版、能分镜：HiDream-O1-Image-1.5 全能图像生成能力解析

雷雷峰网2026年6月10日 23:43约 2 分钟阅读↗ 查看原文

主要内容

智象未来（HiDream.ai）专注于视觉生成大模型，采用原生全模态路线。其UiT架构将图像、文本等模态统一到共享Token空间，区别于传统模块化模型。本次发布的1.5版本是商用升级，此前开源版已获开源榜单第一。

该模型在复杂版面、多语言文字、多主体一致性等任务上表现突出，直接降低广告海报、IP设计、电商视觉的制作门槛。开发者可在商用场景中替代传统步骤，减少多模型串联的精度损失。

🇨🇳

对中国用户与市场

国内用户可通过vivago.ai和hiharness.ai体验商用版，开源模型可从GitHub/Huggingface获取。对中小企业、独立创作者是低成本的图像生成生产力工具，但需注意商用授权范围与API费用。

⚠尚未确定的部分

→可采取的行动

把底层架构优势转化为视觉生产力工具

从单张图像生成的入口到连续世界建模

#智象未来#HiDream-O1-Image-1.5#Artificial Analysis#Unified Transformer (UiT)#OpenAI#NVIDIA#字节跳动#Google#图像生成#文生图

🤖 本文根据雷峰网的 RSS 内容整理，并由 AI 辅助提炼要点。完整上下文请以原文为准。