Aleph
Aleph 是一个用于索引海量文档和结构化数据的工具,专为调查报道中的实体交叉引用而设计。
スマートダウンロード
プロジェクトのホームページへ
インストーラはまだありません — ソースリポジトリをご覧ください
调查记者必备的文档索引与实体关联搜索工具
主な機能
- 支持 PDF、Word、HTML、CSV、XLS、SQL 等多种格式的数据导入和索引
- 自动识别文档中的人名、公司、地点等实体,并支持自定义观察名单进行交叉匹配
- 提供全文搜索、过滤、高级查询功能,可快速定位相关信息
- 支持多用户协作和权限管理,适合团队调查项目
- 拥有 RESTful API,可与其他工具集成
できないこと
- •该项目已停止主动开发,新用户建议直接使用 Aleph Pro(商业 SaaS)。自建实例需注意 2025 年 12 月后无安全更新,可能存在安全隐患。同时开发分支 (develop) 包含未稳定代码,部署应使用 main 分支的正式版本。
使用例
- 调查记者整理泄露文件,自动关联其中出现的政要、公司
- 非政府组织分析公开商业注册数据,发现空壳公司网络
- 学术研究者对大量历史文档进行实体关系分析
詳細説明
Aleph 是一个开源的数据索引平台,专门为调查记者和研究人员设计。它能够处理大量文档(PDF、Word、HTML)和结构化数据(CSV、XLS、SQL),提供强大的搜索和浏览功能。核心亮点是实体交叉引用:您可以快速将文档中提及的人物、公司等实体与已有的观察名单(如公共数据集或历史研究结果)进行匹配,从而发现隐藏的联系。该项目目前处于停用状态,官方已转向商业版 Aleph Pro,遗留版本将在 2025 年 12 月后停止维护。
トラブルシューティング & FAQ (2)
トラブル対応PDF処理時にAleph ingest-fileで発生する'SQLite objects created in a thread can only be used in that same thread'エラーの修正方法
Aleph構成で、ALEPH_DATABASE_URIとFTM_DATABASE_URIの環境変数(または直接TAGS_DATABASE_URI)を設定してください。デフォルトでは、これらがaleph.env.tmpl内でコメントアウトされている場合、TagsデータベースURIはsqlite:///にフォールバックしますが、これはマルチスレッド書き込みを処理できません。コメントアウトを解除し、メインデータベース接続文字列(例えば、デフォルトのPostgres設定ではpostgresql://aleph:aleph@aleph-db/aleph)に設定してください。これにより、ingest-fileバージョン3.22.0および4.0.0のスレッディングエラーが解決されます。
トラブル対応AlephでのOAuthログイン中に表示される'DELETE statement expected to delete 1 row(s); Only 2 were matched'エラーを修正する方法
このエラーは、role_membership テーブル内の重複行が原因で発生し、グループ同期中にSQLAlchemyが不一致に遭遇します。修正方法:1) 重複を特定する:SELECT group_id, member_id, COUNT(*) FROM role_membership GROUP BY group_id, member_id HAVING COUNT(*) > 1; 2) 余分な行を手動で削除します。3) 一意制約を追加して再発を防止する:ALTER TABLE role_membership ADD UNIQUE (group_id, member_id); (または、データベースマイグレーションを作成して UniqueConstraint('group_id', 'member_id') を追加します)。これらの手順の後、OAuthコールバックは正しく動作します。
タグ
はじめ方
ソフトウェアをインストール
ダウンロードしたインストーラをダブルクリックし、指示に従ってください
步骤1:参考官方安装文档 https://docs.aleph.occrp.org/developers/installation 准备 Docker 环境
步骤2:克隆仓库并运行 docker-compose up -d
步骤3:访问 http://localhost:8080 初始化管理员账户
- 步骤1:参考官方安装文档 https://docs.aleph.occrp.org/developers/installation 准备 Docker 环境
- 步骤2:克隆仓库并运行 docker-compose up -d
- 步骤3:访问 http://localhost:8080 初始化管理员账户
チェックサムがありません
このプロジェクトは GitHub Release ページに SHA-256 チェックサムを公開していません
SHA256 チェックサム
チェックサムなし
GitHub Releases から直接ダウンロードし、ファイルの整合性をご自身で確認してください
本プラットフォーム上のすべての SHA-256 チェックサムは、プロジェクトの公式 GitHub Release ページから抽出されたもので、一切の改変はありません。GitHub Releases ページで独自に検証できます。
オープンソースの透明性
GitHub ソースを見るアンインストール情報
停止 Docker 容器并删除相关数据卷:docker-compose down -v。注意所有数据丢失前请自行备份。
追加の依存関係なし
ダウンロード後すぐに使用可能。追加のランタイムは不要です。
問題が発生?以下のFAQを確認
2 FAQs