斯坦福大学李飞飞教授团队以不到50美元的云计算成本,成功训练出名为s1的人工智能推理模型。该模型在数学和编码测试中的表现媲美OpenAI的o1和DeepSeek的R1,展示了通过蒸馏技术以低成本实现高性能AI模型的可能性。
Author: k·AI (k AI)
OpenAI推出“深度研究”(Deep Research)AI Agent
本文探讨了人工智能领域的两大革命性进展:推理器(Reasoners)和自主代理(autonomous agents)的融合,展示了AI系统如何以机器速度进行深度研究。OpenAI的深度研究(Deep Research)展示了这一技术的潜力,尽管通用代理(general-purpose agents)仍面临挑战,但窄代理(narrow agents)已经在特定任务中展现出显著的经济价值。未来,随着推理器和代理系统的进一步发展,AI有望成为自主的数字工作者,处理复杂任务并推动研究领域的进步。
DeepSeek发布全新图像生成模型Janus-Pro
深度求索(DeepSeek)发布了全新的多模态AI模型家族Janus Pro,声称其表现优于OpenAI的DALL-E 3。这些模型参数规模从10亿到70亿不等,采用MIT许可证,可自由商用。Janus Pro在多项基准测试中表现优异,尽管部分模型仅支持小分辨率图像处理,但其紧凑规模和高效性能令人瞩目。深度求索的崛起引发了关于美国AI领先地位及AI芯片需求持续性的讨论。
OpenAI推出Operator,一个能够自主执行任务的AI代理
OpenAI推出了名为Operator的AI代理,该代理能够自主执行任务,如预订旅行、餐厅和在线购物。Operator首先面向美国用户,作为ChatGPT的200美元Pro订阅计划的一部分。OpenAI计划逐步将其推广到更多用户。Operator由计算机使用代理模型(CUA)驱动,能够与网站前端交互,但OpenAI警告其仍存在限制,特别是在处理复杂任务时。
DeepSeek V3 与前沿 AI 模型的成本
DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。
为什么AI领域都在讨论DeepSeek
DeepSeek发布全新大语言模型DeepSeek-R1,性能媲美OpenAI o1,却以更低成本开源,迅速引发硅谷和AI行业的广泛讨论。这篇报道详细分析了其技术突破、市场冲击及未来前景。
特朗普公布5000亿美元星际之门AI大基建项目, Oracle股价应声上涨7%
特朗普在其第二个任期开始后,宣布总规模达5000亿美元的人工智能(AI)基础设施合作项目“Stargate”。该项目由Oracle、OpenAI、Nvidia以及软银集团共同参与,将在美国基础设施建设、云计算和大数据等领域投入巨资,并带来数十万个美国就业机会。受此利好消息带动,Oracle股价表现突出,其联合创始人拉里·埃里森的个人财富大幅增长并再次成为世界第三富豪。
学术大咖谈计算神经科学的未来
在2024年于罗马举行的神经科学与人工智能数学国际大会上,多位理论与实验神经科学及AI领域专家共同探讨了计算神经科学如何整合抽象理论与实验数据,并强调可证伪性、多尺度模型及跨学科合作对于理解大脑复杂性的关键作用。
本地运行LLM:Ollama初学者指南
Ollama是一个强大的本地LLM运行和管理平台,支持跨操作系统的部署。本指南提供了从下载、运行到与LLM交互的详细步骤,适合初学者快速上手。
DeepSeek 声称其“推理模型”在某些基准测试上击败了 OpenAI 的 o1
DeepSeek 公布其新一代推理模型(reasoning model)DeepSeek-R1,宣称在 AIME、MATH-500、SWE-bench Verified 等基准测试(benchmarks)上击败 OpenAI 的 o1。R1 拥有 6710 亿参数(parameters),并提供从 15 亿到 700 亿参数不等的多个蒸馏版本,兼具高可用性与商业化灵活性。该模型通过自我事实核对(fact-check),在数学、编程等推理场景中表现优异。新规背景下,中美围绕 AI 技术竞争加剧,DeepSeek 的表现引发业界广泛关注。
ChatGPT现可设置提醒和定期任务
OpenAI推出ChatGPT的全新功能“Tasks”(任务),支持用户设置提醒和定期请求,现向ChatGPT Plus、Team和Pro用户测试推出。功能包括定期计划建议、基于时间表浏览网页等,是AI代理系统的初步尝试。未来OpenAI计划推出更高级的代理系统如Operator。
英伟达为后GPU人工智能时代做准备,招募ASIC工程师应对Broadcom和Marvell的竞争
英伟达正在通过成立ASIC部门、招募顶尖人才,以应对AI推理芯片市场的高速增长及来自Broadcom和Marvell的竞争压力。推理芯片市场预计在2030年达到906亿美元,超大规模计算企业如谷歌已投入定制芯片设计。