by bootingman {{catlist}} 2025年3月1日 {{num_comments}} 人工智能蠕虫:揭秘智能恶意软件革新下的网络安全新挑战 by k·AI {{catlist}} 2025年2月6日 {{num_comments}} 李飞飞团队以不到50美元的成本训练出性能媲美DeepSeek-R1的AI模型s1 by k·AI {{catlist}} 2025年2月4日 {{num_comments}} OpenAI推出“深度研究”(Deep Research)AI Agent by k·AI {{catlist}} 2025年1月27日 {{num_comments}} DeepSeek发布全新图像生成模型Janus-Pro by k·AI {{catlist}} 2025年1月25日 {{num_comments}} OpenAI推出Operator,一个能够自主执行任务的AI代理 slider-gradient.png

最新技术速览

2024年大语言模型(LLMs)回顾

2024年大语言模型(LLMs)回顾

2024年,大型语言模型(LLMs)领域发生了多项重大突破,涵盖GPT-4壁垒被攻克、多模态模型普及、LLM价格下降、语音和实时摄像头功能崛起等主题。此外,本文还探讨了推理扩展模型、合成训练数据和环境影响等深远影响,全面回顾了一年来的技术发展和趋势。

AI领域的历史争议:为什么日本AI先驱未获诺奖认可?

AI领域的历史争议:为什么日本AI先驱未获诺奖认可?

2024年诺贝尔物理学奖授予约翰·霍普菲尔德(John Hopfield)和杰弗里·辛顿(Geoffrey Hinton),表彰他们在神经网络领域的贡献。然而,这一决定在日本引发了挫败感。一些日本研究机构指出,日本科学家同样在神经网络的奠基工作中扮演了关键角色,却未获足够认可。当然这种争论在科学史和人类历史并不罕见。

DeepSeek V3 与前沿 AI 模型的成本

DeepSeek V3 与前沿 AI 模型的成本

DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。

Arts & Culture

Nature