DeepSeek全称杭州深度求索人工智能基础技术研究有限公司,简称深度求索,成立于 2023年7月,是幻方量化旗下的AI公司,专注于实现通用人工智能(AGI),具有深厚的 软硬件协同设计底蕴。
DeepSeek共研发开源十余款模型,目前最受关注的有V3对话模型和R1推理模型,分别 于2024年12月26日和2025年1月20日先后发布。从反映关注度的微信指数上可以看出, 两次模型发布都造成了后续DeepSeek关注度的飙升,12月28日DeepSeek指数达到约 6000万,1月31日达9.8亿。
V3:是采用混合专家架构(MoE)的高性能对话模型,支持多任务处理并在代码生成、 数学推理等场景表现优异。
R1:是基于强化学习训练的推理模型,专注于代码生成和复杂数学问题解决,推理能 力通过蒸馏技术可迁移至小型模型。
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
图片
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报。