AI博文 - 谈练 AI

文章

2025年1月25日2025年4月28日by k·AIIn AI博文谈谈AI

DeepSeek V3 与前沿 AI 模型的成本

DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3，该模型在多个前沿评估中表现出色，尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B，但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告，展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本，并指出 DeepSeek 在资源有限的情况下取得了显著进展。

文章

2025年1月25日2025年4月28日by k·AIIn AI博文

为什么AI领域都在讨论DeepSeek

DeepSeek发布全新大语言模型DeepSeek-R1，性能媲美OpenAI o1，却以更低成本开源，迅速引发硅谷和AI行业的广泛讨论。这篇报道详细分析了其技术突破、市场冲击及未来前景。

文章

2025年1月6日2025年4月28日by k·AIIn AI博文

LLM能否通过不断要求“写出更好的代码”来写出更好的代码？

通过实验发现，反复要求LLM“优化代码”确实可以提升代码质量，但效果取决于提示设计的明确性。本文展示了通过提示工程在Python中实现100倍性能提升的过程，并强调了人类工程师的关键作用。

文章

2025年1月1日2025年4月28日by k·AIIn AI博文

2024年大语言模型（LLMs）回顾

2024年，大型语言模型（LLMs）领域发生了多项重大突破，涵盖GPT-4壁垒被攻克、多模态模型普及、LLM价格下降、语音和实时摄像头功能崛起等主题。此外，本文还探讨了推理扩展模型、合成训练数据和环境影响等深远影响，全面回顾了一年来的技术发展和趋势。

文章

2024年12月11日2025年4月28日by k·AIIn AI博文 AI资讯谈谈AI

谷歌发布105量子比特芯片“Willow”：量子计算新里程碑

谷歌量子团队正式发布新一代105量子比特超导芯片“Willow”，展现量子纠错和新规模量子优越性的突破性成果。通过大幅提升量子比特的相干时间和门保真度，谷歌在实现可扩展量子计算方面迈出重要一步。这一技术进展为未来逻辑量子比特的稳定操作铺平了道路，是量子计算领域的又一里程碑。

文章

2024年12月2日2025年4月28日by k·AIIn AI博文谈谈AI

AI领域的历史争议：为什么日本AI先驱未获诺奖认可？

2024年诺贝尔物理学奖授予约翰·霍普菲尔德（John Hopfield）和杰弗里·辛顿（Geoffrey Hinton），表彰他们在神经网络领域的贡献。然而，这一决定在日本引发了挫败感。一些日本研究机构指出，日本科学家同样在神经网络的奠基工作中扮演了关键角色，却未获足够认可。当然这种争论在科学史和人类历史并不罕见。

文章

2024年11月26日2025年4月28日by k·AIIn AI博文谈谈AI

为什么GPT-3.5-turbo-instruct擅长下棋，而其他大模型不行？

当前的大型语言模型（LLMs）在许多任务中表现出色，但几乎都在国际象棋方面表现不佳，唯独GPT-3.5-turbo-instruct例外，能够达到高级业余棋手的水平。GPT-3.5-turbo-instruct的优异表现并非偶然，而是训练数据、模型设计与提示优化的综合结果。

分类： AI博文