Question 1

ソースからのビルドによるfunasrのpip installが遅い問題を修正するには？

Accepted Answer

funasr v1.3.9以降にアップグレードしてください。これにはプレビルドされたユニバーサルホイール（`py3-none-any`）が含まれており、ソースビルドの手順が不要になります。`pip install funasr>=1.3.9`を使用してください。古いバージョンではソースビルドは実質的に何も行いませんでしたが、ホイールによりビルドのオーバーヘッドが完全に排除されます。

Question 2

vLLM で FunASR 1.3.7 の repetition_penalty 使用時に発生する CUDA error 'device-side assert triggered' の修正方法

Accepted Answer

これは、vLLMにおけるrepetition_penaltyとenable_prompt_embeds=Trueの非互換性によって発生します。vllm_engine.generate()の呼び出しからrepetition_penalty=1.3を削除してください。回避策として、推論時に音声を25秒以下のチャンクに分割し、truncate_repetition()後処理関数を使用して繰り返しを抑制します。切り詰めロジックの例: def truncate_repetition(text, min_repeat_len=5, max_repeats=3): ... 。次期FunASRバージョンでは、チャンキングと後処理が正式に採用される予定です。

Question 3

Qwen3-ASRがオフラインモードのみをサポートしている場合、WebSocketを介してリアルタイム音声認識を実行する方法は？

Accepted Answer

Qwen3-ASRはWebSocketリアルタイムストリーミングをサポートしていません（AutoModel経由のオフラインのみ）。WebSocketストリーミングには、FunASRのリアルタイムサーバーと共にFun-ASR-Nanoモデルを使用してください。インストール：`pip install funasr>=1.3.5 vllm>=0.12.0`（バージョン1.3.5では、`dynamic_vad`および`vllm.inputs.data`のインポートに関するModuleNotFoundErrorが修正されています）。サーバーの起動：`python examples/industrial_data_pretraining/fun_asr_nano/serve_realtime_ws.py --port 10095 --language 中文`。クライアント：ブラウザで`client_mic.html`を開くか、`client_python.py`を使用します。ドキュメント：https://github.com/modelscope/FunASR/blob/main/docs/vllm_guide.md

Question 4

認証されていないHugging FaceリクエストによるFunASRリアルタイムサーブのダウンロード失敗を修正する方法

Accepted Answer

レート制限やダウンロードの問題を避けるために、Hugging Face tokenを設定してください。サーバーを起動する前に、HF_TOKEN='your_token'をエクスポートするか、huggingface-cli loginを使用して認証情報をキャッシュしてください。それでもダウンロードが失敗する場合は、手動でモデルを https://huggingface.co/FunAudioLLM/Fun-ASR-Nano-2512 からダウンロードし、--modelにローカルパスを指定してください。

FunASR

概要

README プレビュー

FAQ (4)

同类型项目

superpowers

everything-claude-code

flutter

langflow