LLM
过去几个月在做 Agent 系统时,我越来越清晰地意识到一件被大家严重低估的事:无论 LLM 变得多强,它都无法真正可靠地判断现实世界的状态。一旦 Agent 进入实际执行层——开户、交易、访问网站、
作者: Andrej Karpathy 编译:Tim,PANews 2025年是大语言模型飞速发展且充满变数的一年,我们取得了丰硕的成果。以下是我个人认为值得关注且稍感意外的“范式变革”,这些变革改变
GPT的横空出世将全球的目光吸引至大语言模型,各行各业都尝试着利用这个“黑科技”提高工作效率,加速行业发展。Future3 Campus携手Footprint Analytics共同深入研究AI与We
原文来源:新智元 图片来源:由无界 AI生成 最近,来自CAIS、CMU、斯坦福、康奈尔、马里兰、宾大等机构的学者又有了令人震惊的发现—— 大语言模型,并不仅仅是黑匣子,或者难以理解的庞大矩阵。在它
以太坊( 以太坊 ) 创始人 Vitalik Buterin 对他所谓的“天真的”人工智能治理表示担忧。 在一个 邮政 在 X 上,Buterin 强调了 EdisonWatch 联合创始人 Eito
OpenAI 刚刚发布 自 2019 年以来,其首批开放权重模型——GPT-OSS-120b 和 GPT-OSS-20b——宣称它们快速、高效,并且通过严格的对抗训练增强了抵御越狱的能力。这种说法持续
中国大陆有超过6亿人正在使用大型语言模型(LLMs)。中国政府允许这些LLM用于商业用途,使用与ChatGPT等人工智能(AI)产品相同的技术。 中国国家互联网信息办公室(CAC)主任庄荣文提供了估计
原文来源:机器之心 图片来源:由无界 AI生成 本综述深入探讨了大型语言模型的资源高效化问题。 近年来,大型语言模型(LLM)如 OpenAI 的 GPT-3 在人工智能领域取得了显著进展。这些模型,
摩根大通已经开始向其分析师团队推出自己的内部生成人工智能产品,专门用于“一般生产力” 该工具被称为“LLM Suite”,在一份内部备忘录中被描述为“类似ChatGPT”。它将用于帮助分析师完成写作、
文章来源:极客公园 作者:靖宇 用不了多久,就是法学硕士抱怨自己头衔被翻译成「大语言模型」了。 图片来源:由无界 AI生成 但凡偷懒一点,喜欢用浏览器或者翻译插件来看英语新闻的同学,估计都免不了在 A
