OpenSource-Hub
F

FluidVoice

SHA-256
3.9k stars·AI 生産性·SHA-256 チェックサム確認済み

FluidVoice は macOS 上で最速のオフライン音声テキスト変換アプリです。完全にローカルで動作し、複数のモデルに対応、遅延ゼロのリアルタイム文字起こしを実現します。

macOSオフライン音声入力の神ツール、複数のモデルに対応、プライバシーは安全、速度は電光石火。

主な機能

  • 离线音声認識:すべての音声からテキストへの変換はローカルで完結し、ネット接続不要
  • 多様な音声モデル:Nemotron、Parakeet、Cohere、Whisperなど7種類のモデルに対応
  • Fluid Intelligence:ローカルAIによる強化、自動フォーマット、スマート大文字化、後処理
  • コマンドモード:音声でMacを操作、アプリ起動、ショートカット実行、システム操作
  • 書き込みモード:任意のアプリのテキストボックスに直接音声入力または文章を書き換え

できないこと

  • Fluid Intelligence モジュールはプライベートクローズドソースであり、完全にはオープンソースではありませんが、コアのディクテーション機能は完全にオープンソースです。
  • 一部のモデル(Cohere、Whisper Large など)はサイズが大きく(1.4GB〜2.9GB)、初回ダウンロードには時間がかかります。
  • コマンドモードはアクセシビリティ権限に依存しており、一部のシステム機能が制限される可能性があります。
  • 対応OSはmacOS(Apple Silicon + Intel)のみで、Windows / iOS 版はありません(計画中)。
  • クラウドAI(OpenAI、Groq など)による強化を使用する場合、データは外部サーバーに送信されますが、デフォルトでは有効になっていません。

使用例

  • 写作とメモ:タイピング不要で、口述するだけで文章、メール、メモの内容を完成できる
  • Mac 音声コントロール:音声コマンドでアプリの起動、ウィンドウの切り替え、システム操作を素早く実行可能

詳細説明

FluidVoiceはmacOS上で最速のオフライン音声テキスト変換アプリケーションです。完全にローカルで動作し、複数の音声モデル(Nemotron、Parakeet、Cohere、Whisper、Apple Speech)をサポートし、ローカルAI拡張機能(Fluid Intelligence)によりスマートなフォーマットと文脈認識による大文字化を実現します。Dragon Naturally SpeakingやGoogle Docsの音声入力などのクラウドソリューションとは異なり、FluidVoiceはすべてのデータをデバイス上に保持し、インターネット接続やAPIキーを必要とせず、プライバシーに優れています。コマンドモード(音声でMacを操作)、書き込みモード(任意のアプリでテキストを編集)、リアルタイムプレビュー、グローバルショートカットキー、アプリごとの設定などの機能を提供します。ネイティブのParakeet実装のおかげで、レイテンシーはほぼゼロであり、同種のツールよりも高速です。コア機能は完全に無料でオープンソースですが、Fluid Intelligenceはより高度なローカル後処理のためのオプションのプライベートモジュールです。注意:macOS(Apple SiliconおよびIntel)のみ対応。一部のモデルは大容量ファイルのダウンロードが必要です。

タグ

语音转文字离线听写macOS本地AI开源

はじめ方

1

インストーラをダウンロード

上のボタンをクリックして、お使いのシステム用のインストーラをダウンロード

2

ソフトウェアをインストール

ダウンロードした dmg ファイルを開き、アプリを Applications にドラッグ

3

使用Homebrewでインストール:brew install --cask fluidvoice、またはGitHubのリリースページから最新版をダウンロード

4

マイクとアクセシビリティ機能の許可を付与(設定で操作)

5

グローバルショートカットキーを設定し、ウィザードで音声モデルを選択。オプションでFluid IntelligenceのローカルAI拡張をダウンロード可能

インストールガイド
  1. 使用Homebrewでインストール:brew install --cask fluidvoice、またはGitHubのリリースページから最新版をダウンロード
  2. マイクとアクセシビリティ機能の許可を付与(設定で操作)
  3. グローバルショートカットキーを設定し、ウィザードで音声モデルを選択。オプションでFluid IntelligenceのローカルAI拡張をダウンロード可能
ファイルの整合性

SHA-256 チェックサム確認済み

GitHub 公式 Release ページから抽出されたチェックサム

SHA256 チェックサム

02fcc860592caee537b3d103b72b2eca6933de3b8b49432997298d67366604a6

このチェックサムは GitHub Release ページから抽出されたものです。ダウンロード後にファイルの整合性を確認してください。

本プラットフォーム上のすべての SHA-256 チェックサムは、プロジェクトの公式 GitHub Release ページから抽出されたもので、一切の改変はありません。GitHub Releases ページで独自に検証できます。

オープンソースの透明性

GitHub ソースを見る
環境ガイド

アンインストール情報

ターミナルで「brew uninstall --cask fluidvoice」を実行するか、アプリケーションを手動でゴミ箱にドラッグし、~/Library/Application Support/FluidVoice や ~/Library/Preferences/com.fluidvoice.plist などの残存ファイルを削除してください。

追加の依存関係なし

ダウンロード後すぐに使用可能。追加のランタイムは不要です。

プロジェクト情報
ライセンスGPL-3.0
最終更新2026-06-29T06:59:36Z
GitHub リポジトリ公式サイト

類似プロジェクト