斯坦福大学李飞飞教授团队以不到50美元的云计算成本,成功训练出名为s1的人工智能推理模型。该模型在数学和编码测试中的表现媲美OpenAI的o1和DeepSeek的R1,展示了通过蒸馏技术以低成本实现高性能AI模型的可能性。
标签: ChatGPT
OpenAI推出“深度研究”(Deep Research)AI Agent
本文探讨了人工智能领域的两大革命性进展:推理器(Reasoners)和自主代理(autonomous agents)的融合,展示了AI系统如何以机器速度进行深度研究。OpenAI的深度研究(Deep Research)展示了这一技术的潜力,尽管通用代理(general-purpose agents)仍面临挑战,但窄代理(narrow agents)已经在特定任务中展现出显著的经济价值。未来,随着推理器和代理系统的进一步发展,AI有望成为自主的数字工作者,处理复杂任务并推动研究领域的进步。
OpenAI推出Operator,一个能够自主执行任务的AI代理
OpenAI推出了名为Operator的AI代理,该代理能够自主执行任务,如预订旅行、餐厅和在线购物。Operator首先面向美国用户,作为ChatGPT的200美元Pro订阅计划的一部分。OpenAI计划逐步将其推广到更多用户。Operator由计算机使用代理模型(CUA)驱动,能够与网站前端交互,但OpenAI警告其仍存在限制,特别是在处理复杂任务时。
DeepSeek V3 与前沿 AI 模型的成本
DeepSeek AI 发布了其最新的通用模型 DeepSeek-V3,该模型在多个前沿评估中表现出色,尤其是在数学和编程竞赛等困难任务上。尽管其激活参数量仅为 37B,但其性能超越了 GPT-4o 和 Claude 3.5。DeepSeek 还分享了详细的技术报告,展示了其在计算效率和模型优化方面的创新。文章探讨了训练前沿 AI 模型的成本,并指出 DeepSeek 在资源有限的情况下取得了显著进展。
为什么AI领域都在讨论DeepSeek
DeepSeek发布全新大语言模型DeepSeek-R1,性能媲美OpenAI o1,却以更低成本开源,迅速引发硅谷和AI行业的广泛讨论。这篇报道详细分析了其技术突破、市场冲击及未来前景。
ChatGPT现可设置提醒和定期任务
OpenAI推出ChatGPT的全新功能“Tasks”(任务),支持用户设置提醒和定期请求,现向ChatGPT Plus、Team和Pro用户测试推出。功能包括定期计划建议、基于时间表浏览网页等,是AI代理系统的初步尝试。未来OpenAI计划推出更高级的代理系统如Operator。
谷歌发布全新AI推理模型Gemini 2.0 Flash Thinking:AI推理进入新阶段
谷歌推出全新AI推理模型Gemini 2.0 Flash Thinking,旨在通过分步推理增强复杂问题的解决能力,并支持多模态任务。这款实验性模型与OpenAI的GPT-4 Turbo展开竞争,同时预示着AI推理和能动AI(Agentic AI)领域的快速发展。
OpenAI吹哨人被发现死于旧金山公寓
26岁前OpenAI研究员Suchir Balaji因举报公司违反版权法而备受关注,近日被发现死于旧金山公寓。他的死亡引发广泛关注,相关信息或成为针对OpenAI版权侵权诉讼的重要证据。
OpenAI推出每月200美元的ChatGPT Pro订阅服务
OpenAI推出ChatGPT Pro订阅服务,月费200美元,为用户提供几乎无限的工具使用权限和独家访问更强大的AI模型o1 pro模式。此服务主要面向深度用户和研究人员,支持复杂数学、科学和编程任务处理。免费计划仍保留,20美元的ChatGPT Plus订阅不变。未来更新将增加网页浏览和文件上传功能,或发布新一代生成式AI视频模型Sora。
马斯克加大法律行动,OpenAI或将广告融入ChatGPT
Elon Musk对OpenAI盈利转型展开法律攻势 埃隆·马斯克(Elon Musk)近日升级了法律行动,试...