OpenSource-Hub
F

FunASR

SHA-256
18.8k stars·AI 生産性·SHA-256 チェックサム確認済み

産業レベルの音声認識ツールキット、170倍のリアルタイム速度、50以上の言語をサポート、話者分離、感情検出、ストリーム認識、OpenAI互換APIを統合。

スマートダウンロード

Download 版をダウンロード

vruntime-llamacpp-v0.1.4 · 7.2 MB

超高速音声認識ツールキット、Whisperより26倍高速、話者分離と感情認識に対応。

主な機能

  • 极致速度:GPU上で340倍リアルタイムが可能、Whisperより26倍高速(Fun-ASR-Nano + vLLM)
  • 50以上の言語対応:中国語・英語・日本語・韓国語・広東語などをカバー、旗艦モデルFun-ASR-Nanoは31言語に対応
  • 話者分離内蔵:追加の統合不要、1行のコードで各話者のタイムスタンプとテキストを取得可能
  • 感情検出:SenseVoiceモデルが音声感情(喜び、悲しみなど)を同時認識
  • ストリーム認識:ParaformerはWebSocketリアルタイムストリームをサポート、会議やライブ配信などのシーンに最適

できないこと

  • 旗舰モデルFun-ASR-Nanoは最大速度を得るためにGPU(NVIDIAなど)が必要です。CPUではSenseVoiceSmallの使用を推奨します。インストール前に、PyTorch(GPU版またはCPU版)がインストールされていることを確認してください。複数モデルを組み合わせる際はVRAM使用量に注意し、公式モデル選択ガイド(model_selection.md)から始めることをお勧めします。

使用例

  • 会議議事録の自動生成:複数の話者を同時に認識し感情ラベルを付与、タイムスタンプ付きテキストを出力
  • スマートカスタマーサービスと音声アシスタント:OpenAI互換APIを統合、ストリーム認識に対応、迅速な応答

詳細説明

FunASRは、本番環境向けのエンドツーエンド音声認識ツールキットであり、最大340倍のリアルタイム速度(Whisper比26倍高速)を実現し、50以上の言語をサポートし、話者分離、感情検出、ストリーム認識を内蔵しています。Whisperのような単一モデル方式とは異なり、FunASRは完全なツールボックスであり、シナリオに応じて自由にモデルを組み合わせることができます(例:SenseVoiceによるCPU推論、Paraformerによる低遅延ストリーム)。これらはすべて統一されたPython APIを介して呼び出せます。MITオープンソースライセンスを採用し、完全に自己ホスト型であり、OpenAI互換のAPIサーバーを提供し、AIエージェントや外部アプリケーションとの統合が容易です。バッチ文字起こしからリアルタイムストリームまで、FunASRはゼロクラウドコストでエンタープライズ級の認識精度を提供します。

タグ

语音识别ASR深度学习多语言实时说话人分离情感检测开源工具Python

はじめ方

1

インストーラをダウンロード

上のボタンをクリックして、お使いのシステム用のインストーラをダウンロード

2

ソフトウェアをインストール

ダウンロードした dmg ファイルを開き、アプリを Applications にドラッグ

3

Python 3.8+ と PyTorch がインストールされていることを確認してください(公式サイトの案内に従ってインストールしてください)

4

`pip install funasr` を実行してツールライブラリをインストールしてください

5

README の Python コード例を参考に、AutoModel でモデルをロードし、generate メソッドを呼び出して音声を認識してください

インストールガイド
  1. Python 3.8+ と PyTorch がインストールされていることを確認してください(公式サイトの案内に従ってインストールしてください)
  2. `pip install funasr` を実行してツールライブラリをインストールしてください
  3. README の Python コード例を参考に、AutoModel でモデルをロードし、generate メソッドを呼び出して音声を認識してください
ファイルの整合性

SHA-256 チェックサム確認済み

GitHub 公式 Release ページから抽出されたチェックサム

SHA256 チェックサム

fbc633301cc9deec54e28a4adf88ac04ab9f9a89fe82ec84cf4df90644ed5321

このチェックサムは GitHub Release ページから抽出されたものです。ダウンロード後にファイルの整合性を確認してください。

本プラットフォーム上のすべての SHA-256 チェックサムは、プロジェクトの公式 GitHub Release ページから抽出されたもので、一切の改変はありません。GitHub Releases ページで独自に検証できます。

オープンソースの透明性

GitHub ソースを見る
環境ガイド

アンインストール情報

`pip uninstall funasr` を実行すると、FunASRライブラリを削除できます。完全にクリーンアップするには、手動でインストールしたPyTorchとtorchaudioも一緒にアンインストールしてください。

追加の依存関係なし

ダウンロード後すぐに使用可能。追加のランタイムは不要です。

プロジェクト情報
ライセンスMIT
最終更新2026-07-03T17:32:14Z
GitHub リポジトリ公式サイト

類似プロジェクト