Question 1

为什么llama.cpp在加载Gemma 4模型时会因'Unknown projector type'错误而崩溃？

Accepted Answer

这是在提交 a731805cedc83c0514cbd808a2e38ec46c759cc2 中引入的一个回归问题。请更新到包含 PR #24091 修复的最新版本。作为临时解决方案，请使用已知可用的早期提交，例如 aa50b2c2a（2026-05-27）。

Question 2

为什么在微调Qwen3.6模型时，llama-finetune会因size_t下溢而崩溃？

Accepted Answer

这是一个已知的数据集初始化（common_opt_dataset_init）中的bug，导致size_t下溢。对common/common.cpp应用以下补丁：将`ggml_opt_dataset_t common_op`修改以修复下溢。然而，对于Qwen3.6（qwen35moe架构）的完整微调尚不支持——应用补丁后，你会在ggml.c:7019处遇到第二个断言，因为该模型的反向传播需要额外的ggml操作（delta-net就地操作、状态清除等），这些操作尚未实现。关注问题#22040以获取进展。

Question 3

为什么 llama.cpp web UI 中的内置工具选择器复选框在直接点击时无法切换？

Accepted Answer

这是一个已知的UI问题。作为临时解决方案，请点击复选框的边缘或关联的标签文本，而不是复选框的中心。状态将会正确更改。根本原因仍在调查中。

Question 4

在ggml中使用多个后端时，如何修复Apple M2/M1上的'ggml_metal_op_cpy'崩溃问题？

Accepted Answer

此崩溃发生在未达到M5/A19版本的Apple Silicon设备上，当ggml调度器在Metal与CPU后端之间插入跨后端复制操作（CPY）时触发。解决方法：确保所有操作分配至单一后端以避免跨后端复制。若崩溃由非连续IM2COL输入引起，请在`ggml_im2col`前添加`ggml_cont()`以将所有操作保留在Metal上。目前尚无永久修复方案；上游问题已跟踪至#22085。

llama.cpp

核心功能

避坑指南

适用场景

标签

快速上手

相似推荐