Question 1

google/gemma-4-12B-it を Heretic で使用すると、KL divergence が NaN になるのはなぜですか？

Accepted Answer

問題は、モデルの出力ロジットの不適切な処理によって引き起こされます。なぜなら、google/gemma-4-12B-itは期待される`Gemma4ForConditionalGeneration`の代わりに`Gemma4UnifiedForConditionalGeneration`を使用しているためです（transformers v5.10.1時点）。これにより、無効な確率分布とNaN KLダイバージェンスが発生します。修正はPR #350で利用可能であり、KLダイバージェンス計算に生の生成ロジットを使用するように切り替えられています。Hereticをこのパッチを含む最新バージョンに更新するか、PR #350の変更を手動で適用してください。

Question 2

HereticがApple Silicon MPS上でUnboundLocalError: cannot access local variable 'analyzer'によりクラッシュするのはなぜですか？

Accepted Answer

これはHeretic v1.2.0における既知の回帰バグです（issue #239）。#301で修正されました。最新のmasterブランチにアップデートしてください：pip install git+https://github.com/p-e-w/heretic.git。この修正は次のPyPIリリースに含まれます。

heretic

概要

README プレビュー

FAQ (2)

同类型项目

hermes-agent

firecrawl

go

markitdown