FunASR

SHA-256

18.8k stars·AI 生産性·SHA-256 チェックサム確認済み

産業レベルの音声認識ツールキット、170倍のリアルタイム速度、50以上の言語をサポート、話者分離、感情検出、ストリーム認識、OpenAI互換APIを統合。

スマートダウンロード

Download 版をダウンロード

vruntime-llamacpp-v0.1.4 · 7.2 MB

超高速音声認識ツールキット、Whisperより26倍高速、話者分離と感情認識に対応。

主な機能

极致速度：GPU上で340倍リアルタイムが可能、Whisperより26倍高速（Fun-ASR-Nano + vLLM）
50以上の言語対応：中国語・英語・日本語・韓国語・広東語などをカバー、旗艦モデルFun-ASR-Nanoは31言語に対応
話者分離内蔵：追加の統合不要、1行のコードで各話者のタイムスタンプとテキストを取得可能
感情検出：SenseVoiceモデルが音声感情（喜び、悲しみなど）を同時認識
ストリーム認識：ParaformerはWebSocketリアルタイムストリームをサポート、会議やライブ配信などのシーンに最適

できないこと

•旗舰モデルFun-ASR-Nanoは最大速度を得るためにGPU（NVIDIAなど）が必要です。CPUではSenseVoiceSmallの使用を推奨します。インストール前に、PyTorch（GPU版またはCPU版）がインストールされていることを確認してください。複数モデルを組み合わせる際はVRAM使用量に注意し、公式モデル選択ガイド（model_selection.md）から始めることをお勧めします。

使用例

会議議事録の自動生成：複数の話者を同時に認識し感情ラベルを付与、タイムスタンプ付きテキストを出力
スマートカスタマーサービスと音声アシスタント：OpenAI互換APIを統合、ストリーム認識に対応、迅速な応答

詳細説明

FunASRは、本番環境向けのエンドツーエンド音声認識ツールキットであり、最大340倍のリアルタイム速度（Whisper比26倍高速）を実現し、50以上の言語をサポートし、話者分離、感情検出、ストリーム認識を内蔵しています。Whisperのような単一モデル方式とは異なり、FunASRは完全なツールボックスであり、シナリオに応じて自由にモデルを組み合わせることができます（例：SenseVoiceによるCPU推論、Paraformerによる低遅延ストリーム）。これらはすべて統一されたPython APIを介して呼び出せます。MITオープンソースライセンスを採用し、完全に自己ホスト型であり、OpenAI互換のAPIサーバーを提供し、AIエージェントや外部アプリケーションとの統合が容易です。バッチ文字起こしからリアルタイムストリームまで、FunASRはゼロクラウドコストでエンタープライズ級の認識精度を提供します。

はじめ方

インストーラをダウンロード

上のボタンをクリックして、お使いのシステム用のインストーラをダウンロード

macOS· 7.2 MB Windows· 7.8 MB

ソフトウェアをインストール

ダウンロードした dmg ファイルを開き、アプリを Applications にドラッグ

Python 3.8+ と PyTorch がインストールされていることを確認してください（公式サイトの案内に従ってインストールしてください）

`pip install funasr` を実行してツールライブラリをインストールしてください

README の Python コード例を参考に、AutoModel でモデルをロードし、generate メソッドを呼び出して音声を認識してください

インストールガイド

Python 3.8+ と PyTorch がインストールされていることを確認してください（公式サイトの案内に従ってインストールしてください）
`pip install funasr` を実行してツールライブラリをインストールしてください
README の Python コード例を参考に、AutoModel でモデルをロードし、generate メソッドを呼び出して音声を認識してください

ファイルの整合性

SHA-256 チェックサム確認済み

GitHub 公式 Release ページから抽出されたチェックサム

SHA256 チェックサム

fbc633301cc9deec54e28a4adf88ac04ab9f9a89fe82ec84cf4df90644ed5321

このチェックサムは GitHub Release ページから抽出されたものです。ダウンロード後にファイルの整合性を確認してください。

本プラットフォーム上のすべての SHA-256 チェックサムは、プロジェクトの公式 GitHub Release ページから抽出されたもので、一切の改変はありません。GitHub Releases ページで独自に検証できます。

オープンソースの透明性

GitHub ソースを見る

環境ガイド

アンインストール情報

`pip uninstall funasr` を実行すると、FunASRライブラリを削除できます。完全にクリーンアップするには、手動でインストールしたPyTorchとtorchaudioも一緒にアンインストールしてください。

追加の依存関係なし

ダウンロード後すぐに使用可能。追加のランタイムは不要です。

プロジェクト情報

ライセンスMIT

最終更新2026-07-03T17:32:14Z

GitHub リポジトリ公式サイト

類似プロジェクト

ollama

在本地一键运行和管理大语言模型的开源工具，支持多种平台和丰富模型。

llama.cpp

純粋なC/C++による高性能大規模モデル推論エンジン。低ビット量子化および多種ハードウェア（Apple Silicon、CUDA、Vulkanなど）をサポート。軽量で組込み可能。

opencv

OpenCVはオープンソースのコンピュータビジョンライブラリであり、2500以上の最適化されたアルゴリズムを提供し、リアルタイムの画像およびビデオ分析をサポートし、AI、ロボット、セキュリティなどの分野に応用されています。