近日,DeepSeek公司对其R1模型完成了一次小版本升级。据官方介绍,此次更新重点提升了语义理解的精准性、复杂逻辑推理能力以及长文本处理的稳定性。1ll数字认知网 - 区块链数字货币实时行情平台
尽管DeepSeek并未透露更多技术细节,但根据网友的实际测评反馈,R1模型在多个方面的表现均有显著改进。例如,在语义理解方面,模型能够生成交互动画展示以激活参数部分,逻辑表达更加清晰;在编程能力上,有网友表示其可一次性生成超过1000行无错误代码,甚至与当前“编程新王”Claude 4不相上下。1ll数字认知网 - 区块链数字货币实时行情平台
这是DeepSeek自今年3月推出DeepSeek-V3-0324模型后的首次更新。V3模型曾在多项评测中超越了GPT-4.5和Claude-3.7-Sonnet,特别是在数学与代码类任务上表现出色,且以极高的性价比引人注目——输入价格仅为Claude-3.7-Sonnet的1/11和GPT-4.5的1/277,并支持开源免费用于商业用途。1ll数字认知网 - 区块链数字货币实时行情平台
Hugging Face的研究员Adina Yakefu指出:升级后的DeepSeek R1在减少幻觉(即提供错误信息)方面取得了重大突破,这表明其不仅在追赶顶级AI模型,更已进入与其正面竞争的阶段。1ll数字认知网 - 区块链数字货币实时行情平台
自今年1月发布以来,DeepSeek R1凭借优于西方竞争对手的表现迅速引发全球关注,甚至一度导致科技股市场波动。然而,随着V3模型的上线,市场对DeepSeek的关注有所降温,更多目光转向了尚未发布的R2模型。此前有消息称,R2将采用混合专家模型(MoE),预计参数量将达到1.2万亿,单位推理成本较GPT-4大幅降低。不过截至目前,DeepSeek仍未公布R2的具体发布时间。1ll数字认知网 - 区块链数字货币实时行情平台
R1推理模型的最新版本R1-0528再次引发了全球媒体的广泛关注。1ll数字认知网 - 区块链数字货币实时行情平台
路透社报道称,此次升级进一步加剧了DeepSeek与美国竞争对手如OpenAI之间的竞争态势。在由加州大学伯克利分校、麻省理工学院和康奈尔大学研究人员开发的LiveCodeBench排行榜中,DeepSeek的R1-0528在代码生成领域仅略逊于OpenAI的o4 mini和o3推理模型,但超过了xAI的Grok 3 mini和阿里巴巴的Qwen 3。1ll数字认知网 - 区块链数字货币实时行情平台
CNBC分析认为,尽管DeepSeek此次升级模型的发布显得较为低调,但其强大的推理能力使其能够胜任更复杂的任务。《华尔街日报》中文版则提到,DeepSeek低成本、高性能的R1模型自年初以来吸引了全球目光,推动了中国科技股的上涨,也显示出市场对中国AI技术能力的乐观预期。1ll数字认知网 - 区块链数字货币实时行情平台