Home AI博文

分类: AI博文

文章
DeepSeek V3 与前沿 AI 模型的成本

DeepSeek V3 与前沿 AI 模型的成本

DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。

文章
为什么AI领域都在讨论DeepSeek

为什么AI领域都在讨论DeepSeek

DeepSeek发布全新大语言模型DeepSeek-R1,性能媲美OpenAI o1,却以更低成本开源,迅速引发硅谷和AI行业的广泛讨论。这篇报道详细分析了其技术突破、市场冲击及未来前景。

文章
2024年大语言模型(LLMs)回顾

2024年大语言模型(LLMs)回顾

2024年,大型语言模型(LLMs)领域发生了多项重大突破,涵盖GPT-4壁垒被攻克、多模态模型普及、LLM价格下降、语音和实时摄像头功能崛起等主题。此外,本文还探讨了推理扩展模型、合成训练数据和环境影响等深远影响,全面回顾了一年来的技术发展和趋势。

文章
谷歌发布105量子比特芯片“Willow”:量子计算新里程碑

谷歌发布105量子比特芯片“Willow”:量子计算新里程碑

谷歌量子团队正式发布新一代105量子比特超导芯片“Willow”,展现量子纠错和新规模量子优越性的突破性成果。通过大幅提升量子比特的相干时间和门保真度,谷歌在实现可扩展量子计算方面迈出重要一步。这一技术进展为未来逻辑量子比特的稳定操作铺平了道路,是量子计算领域的又一里程碑。

文章
AI领域的历史争议:为什么日本AI先驱未获诺奖认可?

AI领域的历史争议:为什么日本AI先驱未获诺奖认可?

2024年诺贝尔物理学奖授予约翰·霍普菲尔德(John Hopfield)和杰弗里·辛顿(Geoffrey Hinton),表彰他们在神经网络领域的贡献。然而,这一决定在日本引发了挫败感。一些日本研究机构指出,日本科学家同样在神经网络的奠基工作中扮演了关键角色,却未获足够认可。当然这种争论在科学史和人类历史并不罕见。