• 售前

  • 售后

“重创”美科技股后,DeepSeek除夕再发新模型,文生图测试优于OpenAI ...

科技 admin
2025-1-28 09:35 5人浏览 0人回复
摘要

  刚刚暴击完美股,国产大模型公司深度求索(DeepSeek)又抛出新模型。   1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DA ...

  刚刚暴击完美股,国产大模型公司深度求索(DeepSeek)又抛出新模型。

  1月28日,DeepSeek发布开源多模态模型Janus-Pro,其中70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

  Github社区信息显示,Janus-Pro是去年发布的Janus的高级版本,可显著提高多模式理解和视觉生成。相比此前的Janus,Janus-Pro优化的训练策略、扩展的训练数据和扩展到更大的模型尺寸。通过这些改进,Janus-Pro在多模态理解和文本到图像的指令遵循能力方面都取得了显著的进步,同时也增强了文本到图像生成的稳定性。

  值得注意的是,就在28日深夜,DeepSeek仅凭一己之力就掀翻了美国科技股。

  截至美股1月27日收盘,道指涨0.65%,标普500指数跌1.46%,纳指跌3.07%。英伟达暴跌16.97%,单日市值蒸发5890亿美元,创史上最大单日个股市值蒸发纪录。英伟达的暴跌也使得创始人黄仁勋的身家大幅缩水210亿美元。

  此外,甲骨文下跌13.78%,超微电脑下跌12.49%,芯片制造商博通下跌17.4%,台积电跌13%。《华尔街日报》称,道琼斯市场数据显示,周一的“市场大屠杀”总共使股市市值蒸发了约1万亿美元。

  消息面上,1月27日早间,DeepSeek应用登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。DeepSeek系量化巨头幻方量化旗下大模型公司,1月20日,该公司正式发布推理大模型DeepSeek-R1。

  推出后不久,R1就凭借其开源的性质、大幅下降的售价和训练成本获得了广泛关注。作为一款开源模型,R1在数学、代码、自然语言推理等任务上的性能能够比肩OpenAI o1模型正式版,并采用MIT许可协议,支持免费商用、任意修改和衍生开发等。

  更令市场惊讶的是,据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成。

  市场人士称,DeepSeek的R1大型语言模型或引发行业重估大模型成本。华尔街开始考虑科技行业巨头对AI基础设施的巨额投资以及对英伟达芯片的需求是否合理。

  值得注意的是,近日DeepSeek需求火爆,AI服务在24小时内经历了多次宕机。服务状态页面显示,“近期DeepSeek线上服务受到大规模恶意攻击,注册可能繁忙,请稍等重试。已注册用户可以正常登录,感谢理解和支持。”

责任编辑:王许宁

0

路过

0

雷人

0

握手

0

鲜花

0

鸡蛋

分享
本文暂无评论,快来抢沙发!

推荐阅读
量子资讯网
超币365定位于全球区块链资讯情报站,集区块链行业新闻、资讯、行情、数据、百科、社区等一站式区块链产业信息服务平台,我们追求及时、全面、专业、准确的资讯与数据,致力于为区块链创业者以及数字货币投资者提供最好的产品和服务。
  • 官方手机版

© 量子资讯网【升级维护中】 2021 - All rights reserved.
Clicky