你的位置：| 北京睿邦国宇科技发展有限责任公司 > 服务项目 > DeepSeek深夜发布多模态大模子图像性能跑分力压OpenAI竞品

DeepSeek深夜发布多模态大模子图像性能跑分力压OpenAI竞品

发布日期：2025-03-05 08:51 点击次数：117

　　开首：财联社

　　就在华尔街周一弥留评估“DeepSeek风暴”之际，这家中国公司再度甩出新品：在图像生成基准测试中高出OpenAI“文生图”模子DALL-E 3的多模态大模子Janus-Pro，相通亦然开源的。

　　除夕凌晨钟声敲响前不久，DeepSeek工程师们在“抱抱脸”平台上传了Janus Pro 7B和1.5B模子。这俩模子是对旧年10月发布的Janus模子的升级。

（Janus与Janus Pro 7B生成图像的对比，开首：技巧申诉）

]article_adlist-->

　　15亿和70亿的参数目，意味着这两个模子具备在耗尽级电脑上土产货驱动的后劲。与R1一样，Janus Pro给与MIT许可证，在商用方面莫得范畴。

　　据DeepSeek先容，Janus-Pro是一个新颖的自追忆框架，调治了多模态意会和生成。通过将视觉编码差别为“意会”和“生成”两条旅途，同期仍给与单一的Transformer架构进行处理，贬责了以往设施的局限性。这种差别不仅缓解了视觉编码器珍惜会和生成中的扮装艰涩，还普及了框架的纯真性。

　　从申诉给出的“跑分”数据来看，在部分文生图基准测试中，Janus-Pro 70亿参数模子施展好于OpenAI的DALL-E 3、Stability AI的Stable Diffusion 3-Meduim等。

（开首：技巧申诉）

　　诚然DALL-E 3是OpenAI在2023年发布的一款“老模子”，同期Janus Pro当今只可分析和生陋习格较小的图像（384 x 384）。DeepSeek在如斯紧凑的模子尺寸中已经展现了令东说念主印象潜入的性能。

　　技巧申诉线路，在视觉生成方面，Janus-Pro通过添加7200万张高质地合成图像，使得在调治预磨砺阶段真确数据与合成数据的比例达到1：1，好意思满“更具视觉诱骗力和解析性的图像输出”。在多模态意会的磨砺数据方面，新模子参考了DeepSeek VL2并加多了简短9000万个样本。

　　当作一个多模态模子，Janus-Pro不仅不错“文生图”，相通也能对图片进行描写，识别地标景点（举例杭州的西湖），识别图像中的笔墨，并能对图片中的学问（举例下图中的“猫和老鼠”蛋糕）进行先容。

　　公司也在申诉中，给出了更多图像生成的案例。

海量资讯、精确解读，尽在新浪财经APP

累赘剪辑：李桐

DeepSeek深夜发布多模态大模子 图像性能跑分力压OpenAI竞品