Question 1

왜 llama.cpp가 Gemma 4 모델을 로드할 때 'Unknown projector type' 오류와 함께 충돌하나요?

Accepted Answer

이것은 커밋 a731805cedc83c0514cbd808a2e38ec46c759cc2에서 도입된 회귀(regression)입니다. PR #24091의 수정 사항이 포함된 최신 버전으로 업데이트하세요. 임시 해결 방법으로, 정상 작동이 확인된 이전 커밋(예: aa50b2c2a, 2026-05-27)을 사용하십시오.

Question 2

llama-finetune이 Qwen3.6 모델을 fine-tuning할 때 size_t underflow로 인해 충돌하는 이유는 무엇인가요?

Accepted Answer

데이터셋 초기화(common_opt_dataset_init)에서 size_t 언더플로우를 일으키는 알려진 버그입니다. common/common.cpp에 다음 패치를 적용하세요: `ggml_opt_dataset_t common_op`를 변경하여 언더플로우를 수정합니다. 그러나 Qwen3.6(qwen35moe 아키텍처)의 전체 파인튜닝은 아직 지원되지 않습니다. 패치를 적용한 후 ggml.c:7019에서 두 번째 어서션(assertion)이 발생합니다. 이 모델의 역전파(backward pass)에는 아직 구현되지 않은 추가 ggml 연산(delta-net inplace ops, state clearing 등)이 필요하기 때문입니다. 진행 상황은 이슈 #22040을 확인하세요.

Question 3

llama.cpp 웹 UI에서 내장 도구 선택기 체크박스가 직접 클릭할 때 토글되지 않는 이유는 무엇인가요?

Accepted Answer

이는 알려진 UI 문제입니다. 해결 방법으로, 체크박스 중앙 대신 체크박스 가장자리나 연결된 레이블 텍스트를 클릭하세요. 상태가 올바르게 변경됩니다. 근본 원인은 아직 조사 중입니다.

Question 4

ggml로 여러 백엔드를 사용할 때 Apple M2/M1에서 'ggml_metal_op_cpy' 충돌을 해결하는 방법?

Accepted Answer

해당 크래시는 ggml 스케줄러가 Metal과 CPU 백엔드 간에 교차 백엔드 복사 연산(CPY)을 삽입할 때 M5 이전/A19 이전 Apple Silicon 기기에서 발생합니다. 해결 방법: 모든 연산이 단일 백엔드에 할당되도록 하여 백엔드 간 복사를 방지하세요. 비연속적인 IM2COL 입력에 의해 크래시가 발생하는 경우, `ggml_im2col` 전에 `ggml_cont()`를 추가하여 모든 연산을 Metal에 유지하세요. 현재 영구적인 수정은 없으며, 업스트림 문제는 #22085에서 추적 중입니다.

llama.cpp

주요 기능

할 수 없는 것

사용 사례

태그

시작하기

유사한 프로젝트