Home LLM

标签: LLM

文章
DeepSeek V3 与前沿 AI 模型的成本

DeepSeek V3 与前沿 AI 模型的成本

DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。

文章
为什么AI领域都在讨论DeepSeek

为什么AI领域都在讨论DeepSeek

DeepSeek发布全新大语言模型DeepSeek-R1,性能媲美OpenAI o1,却以更低成本开源,迅速引发硅谷和AI行业的广泛讨论。这篇报道详细分析了其技术突破、市场冲击及未来前景。

文章
2024年大语言模型(LLMs)回顾

2024年大语言模型(LLMs)回顾

2024年,大型语言模型(LLMs)领域发生了多项重大突破,涵盖GPT-4壁垒被攻克、多模态模型普及、LLM价格下降、语音和实时摄像头功能崛起等主题。此外,本文还探讨了推理扩展模型、合成训练数据和环境影响等深远影响,全面回顾了一年来的技术发展和趋势。

文章
AI生成诗歌能否媲美人类创作?Nature论文引发争议

AI生成诗歌能否媲美人类创作?Nature论文引发争议

AI生成诗歌能否媲美人类创作?一篇发表在Nature的论文指出,AI生成诗歌因其简洁易读的特点更受普通读者欢迎,引发学术界关于诗歌艺术与AI创作本质的热议。论文方法和受试者选择遭到批评,专家认为AI缺乏情感与创新能力,无法触及诗歌创作的核心本质。探索AI创作与人类艺术的边界仍是未来重要方向。