Question 1

なぜllama.cppはGemma 4モデルを読み込む際に'Unknown projector type'エラーでクラッシュするのですか？

Accepted Answer

これはコミットa731805cedc83c0514cbd808a2e38ec46c759cc2で導入されたリグレッションです。PR #24091の修正を含む最新バージョンにアップデートしてください。暫定的な回避策として、動作が確認されているaa50b2c2a（2026-05-27）などの以前のコミットを使用してください。

Question 2

llama-finetune が Qwen3.6 モデルをファインチューニングする際に size_t アンダーフローでクラッシュするのはなぜですか？

Accepted Answer

これは、データセット初期化 (common_opt_dataset_init) における既知のバグで、size_t underflow を引き起こします。common/common.cpp に以下のパッチを適用してください: `ggml_opt_dataset_t common_op` を変更してアンダーフローを修正します。ただし、Qwen3.6 (qwen35moe アーキテクチャ) の完全なファインチューニングはまだサポートされていません — パッチ適用後、ggml.c:7019 で2つ目の assertion に引っかかります。なぜなら、このモデルの backward pass には追加の ggml 操作 (delta-net inplace ops, state clearing など) が必要ですが、これらがまだ実装されていないからです。進捗状況は issue #22040 を監視してください。

Question 3

llama.cpp web UIの組み込みツールセレクタチェックボックスは、直接クリックしても切り替わらないのはなぜですか？

Accepted Answer

これは既知のUIの問題です。回避策として、チェックボックスの中央ではなく、チェックボックスの端または関連するラベルテキストをクリックしてください。状態は正しく変わります。根本原因はまだ調査中です。

Question 4

複数のバックエンドをggmlで使用する際に、Apple M2/M1で 'ggml_metal_op_cpy' クラッシュを修正する方法

Accepted Answer

このクラッシュは、ggmlスケジューラがMetalとCPUバックエンド間でクロスバックエンドコピー操作（CPY）を挿入する際に、pre-M5/pre-A19 Apple Siliconデバイスで発生します。回避策：すべての操作を単一のバックエンドに割り当て、バックエンド間コピーを回避します。非連続なIM2COL入力によってクラッシュが発生する場合は、`ggml_im2col`の前に`ggml_cont()`を追加し、すべての操作をMetal上に維持してください。現在恒久的な修正はありません。上流の課題は#22085で追跡されています。

llama.cpp

主な機能

できないこと

使用例

タグ

はじめ方

類似プロジェクト