Aleph
Aleph 是一个用于索引海量文档和结构化数据的工具,专为调查报道中的实体交叉引用而设计。
스마트 다운로드
프로젝트 홈페이지 방문
아직 설치 프로그램이 없습니다 — 소스 저장소로 이동하세요
调查记者必备的文档索引与实体关联搜索工具
주요 기능
- 支持 PDF、Word、HTML、CSV、XLS、SQL 等多种格式的数据导入和索引
- 自动识别文档中的人名、公司、地点等实体,并支持自定义观察名单进行交叉匹配
- 提供全文搜索、过滤、高级查询功能,可快速定位相关信息
- 支持多用户协作和权限管理,适合团队调查项目
- 拥有 RESTful API,可与其他工具集成
할 수 없는 것
- •该项目已停止主动开发,新用户建议直接使用 Aleph Pro(商业 SaaS)。自建实例需注意 2025 年 12 月后无安全更新,可能存在安全隐患。同时开发分支 (develop) 包含未稳定代码,部署应使用 main 分支的正式版本。
사용 사례
- 调查记者整理泄露文件,自动关联其中出现的政要、公司
- 非政府组织分析公开商业注册数据,发现空壳公司网络
- 学术研究者对大量历史文档进行实体关系分析
상세 설명
Aleph 是一个开源的数据索引平台,专门为调查记者和研究人员设计。它能够处理大量文档(PDF、Word、HTML)和结构化数据(CSV、XLS、SQL),提供强大的搜索和浏览功能。核心亮点是实体交叉引用:您可以快速将文档中提及的人物、公司等实体与已有的观察名单(如公共数据集或历史研究结果)进行匹配,从而发现隐藏的联系。该项目目前处于停用状态,官方已转向商业版 Aleph Pro,遗留版本将在 2025 年 12 月后停止维护。
문제 해결 & FAQ (2)
문제 해결PDF를 처리할 때 Aleph ingest-file에서 발생하는 'SQLite objects created in a thread can only be used in that same thread' 오류를 수정하는 방법.
Aleph 설정에서 ALEPH_DATABASE_URI와 FTM_DATABASE_URI 환경 변수(또는 직접 TAGS_DATABASE_URI)를 설정하십시오. 기본적으로 aleph.env.tmpl에서 이 값들이 주석 처리되어 있으면 Tags 데이터베이스 URI는 sqlite:///로 대체되며, 이는 멀티스레드 쓰기를 처리할 수 없습니다. 주석을 해제하고 기본 Postgres 설정의 경우 postgresql://aleph:aleph@aleph-db/aleph와 같은 주 데이터베이스 연결 문자열로 설정하십시오. 이렇게 하면 ingest-file 버전 3.22.0 및 4.0.0의 스레딩 오류가 해결됩니다.
문제 해결Aleph에서 OAuth 로그인 중 'DELETE statement expected to delete 1 row(s); Only 2 were matched' 오류를 수정하는 방법?
이 오류는 role_membership 테이블에 중복 행이 존재하여 그룹 동기화 중 SQLAlchemy가 불일치를 겪을 때 발생합니다. 수정 방법: 1) 다음 쿼리로 중복 식별: SELECT group_id, member_id, COUNT(*) FROM role_membership GROUP BY group_id, member_id HAVING COUNT(*) > 1; 2) 추가 행을 수동으로 제거. 3) 고유 제약 조건을 추가하여 재발 방지: ALTER TABLE role_membership ADD UNIQUE (group_id, member_id); (또는 데이터베이스 마이그레이션을 생성하여 UniqueConstraint('group_id', 'member_id')를 추가). 이 단계를 거치면 OAuth 콜백이 올바르게 작동합니다.
태그
시작하기
소프트웨어 설치
다운로드한 설치 프로그램을 더블 클릭하고 안내에 따르세요
步骤1:参考官方安装文档 https://docs.aleph.occrp.org/developers/installation 准备 Docker 环境
步骤2:克隆仓库并运行 docker-compose up -d
步骤3:访问 http://localhost:8080 初始化管理员账户
- 步骤1:参考官方安装文档 https://docs.aleph.occrp.org/developers/installation 准备 Docker 环境
- 步骤2:克隆仓库并运行 docker-compose up -d
- 步骤3:访问 http://localhost:8080 初始化管理员账户
체크섬 없음
이 프로젝트는 GitHub Release 페이지에 SHA-256 체크섬을 게시하지 않았습니다
SHA256 체크섬
체크섬 없음
GitHub Releases에서 직접 다운로드하고 파일 무결성을 직접 확인하세요
이 플랫폼의 모든 SHA-256 체크섬은 프로젝트의 공식 GitHub Release 페이지에서 추출되었으며, 어떠한 변경도 없습니다. GitHub Releases 페이지에서 직접 검증할 수 있습니다.
오픈소스 투명성
GitHub 소스 보기제거 정보
停止 Docker 容器并删除相关数据卷:docker-compose down -v。注意所有数据丢失前请自行备份。
추가 의존성 없음
다운로드 후 바로 사용 가능. 추가 런타임이 필요하지 않습니다.
문제 발생? 아래 FAQ 확인
2 FAQs