据澎湃新闻消息,刚刚暴击完美股,国产大模型公司深度求索(DeepSeek)又抛出新模型。

1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的DALL-E 3和Stability AI的Stable Diffusion。

Github社区信息显示,Janus-Pro是去年发布的Janus的高级版本,可显著提高多模式理解和视觉生成。相比此前的Janus,Janus-Pro优化的训练策略、扩展的训练数据和扩展到更大的模型尺寸。

通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。

DeepSeek遭大规模恶意攻击

1月28日,DeepSeek官网的服务状态页面显示:近期DeepSeek线上服务受到大规模恶意攻击,为持续提供服务,暂时限制了+86手机号以外的注册方式,已注册用户可以正常登录,感谢理解和支持。

图源:DeepSeek官方网站

DeepSeek服务需求激增

1月20日,DeepSeek推出了AI模型R1,推出后不久,R1就凭借其性价比、开源及推理能力的提升等方面获得了广泛关注。DeepSeek表示,最新的AI模型可以与OpenAI的ChatGPT媲美,且开发成本远低于竞争产品。

市场人士称,DeepSeek的R1大型语言模型或引发行业重估大模型成本。华尔街开始考虑科技行业巨头对AI基础设施的巨额投资以及对英伟达芯片的需求是否合理。

环球时报1月27日称,Deepseek被认为是大模型行业的最大“黑马”,在外网被不少人称为“神秘的东方力量”。

在海外出圈之后,DeepSeek的服务需求激增。此前据媒体报道,DeepSeek旗下AI(人工智能)服务经历了多次宕机,可能与新模型发布后的访问量激增有关。

此前报道:

深夜,英伟达骤然暴跌!

来源:澎湃新闻、长安街知事、环球网、环球时报

监制:刘昊

编辑:李俊瑶