微调 - 区块链加密货币研究中心

发表于 2026-01-21 FireAct 微调 React

原文来源：机器之心图片来源：由无界 AI‌生成重生了，这辈子我重生成了 MidReal。一个可以帮别人写「网文」的 AI 机器人。这段时间里，我看到很多选题，偶尔也会吐槽一下。竟然有人让我写写

发表于 2026-01-21 猎户 Orion 微调

原文来源：新智元图片来源：由无界 AI生成就在刚刚，OpenAI的最大秘密，被傅盛在130万人面前揭穿！百亿参数，竟能在企业级应用中媲美千亿级大模型；一张3060，就能帮老板打到「王者」！当全世

发表于 2026-01-21 Stability 微调 Decrypt

Stability AI为其Stable Diffusion 3（SD3）模型发布了一个经过改进的社区许可证，旨在平息首次发布后爆发的争议风暴。该公司此举是在主要社区中心CivitAI发布禁令之后做出

发表于 2026-01-21 正确率 COT 微调

惊人发现：大模型在知识推演上存在严重缺陷。灵活运用知识是智慧的关键。人脑可以快速处理知识，如快速回答 “《静夜思》中有几个月字”。那么，大模型是否能进行类似操作？已知大模型可以通过思维链（Chain

发表于 2026-01-21 TURBO 微调 OpenAI

原文来源：新智元图片来源：由无界 AI生成虽说预训练语言模型可以在零样本（zero-shot）设置下，对新任务实现非常好的泛化性能，但在现实应用时，往往还需要针对特定用例对模型进行微调。不过，微

发表于 2026-01-21 Colossal 微调训练

图片来源：由无界 AI 生成 ChatGPT 引发的大模型热潮愈演愈烈，全球科技巨头和明星初创争相入局，打造以 AI 大模型为核心的竞争力和多样化商业使用需求。其中 LLaMA 系列模型，因良好的基

发表于 2026-01-21 Gemma 微调 Google

文章来源：学术头条 ‌刚刚，谷歌在大模型领域又有了新动作：重磅推出了一系列轻量级、先进的开放模型 Gemma 。据介绍，Gemma 由 Google DeepMind 和 Google 的其他团队

发表于 2026-01-21 微调 LoRa 文本

指南：如何添加洛拉与重量稳定扩散？在不断发展的机器学习领域，融合尖端技术至关重要。其中一个备受关注的创新是将多个Lora与权重稳定扩散相融合。在本指南中，我们将探讨这种集成的复杂性，提供一种逐步提

发表于 2026-01-21 微调魔法研究

文章来源：量子位图片来源：由无界 AI生成最近微软一项研究让Llama 2选择性失忆了，把哈利波特忘得一干二净。现在问模型“哈利波特是谁？”，它的回答是这样婶儿的：木有赫敏、罗恩，木有霍格沃茨

发表于 2026-01-21 传记 she 微调

来源：机器之心随着模型规模的增大，人们开始探索大模型是如何掌握大量知识的。一种观点认为这归功于 “无损压缩”，即模型通过大量训练，记忆更多内容以提高预测精度。但 “无损压缩” 真的能让大模型理解这些