ArchiveBox
开源自托管网页存档工具,自动保存网页、社交媒体、视频等多格式快照,并提供 Web 界面和命令行管理。
智能下载
前往项目主页
该项目暂未提供安装包,请直接访问源代码仓库
把网页永久保存成多种格式,自托管,不怕链接失效。
核心功能
- 保存网页为 HTML、PDF、截图、WARC、纯文本等 10+ 种格式
- 自动提取 YouTube 视频、SoundCloud 音频、GitHub 代码仓库
- 支持批量导入书签(Pocket、Pinboard、浏览器历史、RSS)
- 提供 Docker 一键部署、Web 管理界面、命令行和 Python API
- 数据以普通文件和文件夹存储,无需 ArchiveBox 即可直接查看
避坑指南
- •首次初始化会下载 Chromium 浏览器(约 200MB),建议良好的网络环境,存档多媒体内容(如 YouTube 视频)会占用大量磁盘空间,Docker 方式更易维护,pip 安装可能因系统依赖(如 Chrome)而出错,默认使用 HTTP 端口 8000,需注意防火墙设置
适用场景
- 个人或企业备份重要网页、书签和在线资料
- 法律取证:保存网页证据,防止内容被删除
- 研究学者存档论文、新闻页面和参考文献
- 收藏社交媒体帖子、视频、播客等数字资产
详细介绍
ArchiveBox 是一款开源的自托管网页存档工具。它能将网页永久保存为多种标准化格式——包括原始 HTML/CSS/JS、整页截图(PNG)、PDF、WARC(Web ARChive)、文章纯文本和元数据。所有文件都以普通文件夹形式存储,不依赖任何专有格式。它还支持提取社交媒体(帖子、评论、图片)、YouTube/SoundCloud(MP3/MP4、字幕)以及 GitHub 仓库(git 克隆)等内容。你可以逐个添加链接,也可批量导入 Pocket/Pinboard 书签、浏览器历史、RSS 订阅,或通过浏览器扩展一键保存。ArchiveBox 提供 Docker Web 界面、命令行和 Python API,即使不使用该工具本身,保存的数据也能在数十年后直接读取。
标签
快速上手
安装软件
双击下载的安装程序,按提示完成安装
步骤 1:创建数据目录并下载 Docker Compose 配置: mkdir -p ~/archivebox/data && cd ~/archivebox curl -fsSL 'https://docker-compose.archivebox.io' > docker-compose.yml
步骤 2:初始化 ArchiveBox: docker compose run archivebox init --install
步骤 3:添加要存档的网址: docker compose run archivebox add 'https://example.com'
- 步骤 1:创建数据目录并下载 Docker Compose 配置: mkdir -p ~/archivebox/data && cd ~/archivebox curl -fsSL 'https://docker-compose.archivebox.io' > docker-compose.yml
- 步骤 2:初始化 ArchiveBox: docker compose run archivebox init --install
- 步骤 3:添加要存档的网址: docker compose run archivebox add 'https://example.com'
暂未获取到校验码
该项目暂未在 GitHub Release 页面提供 SHA-256 校验码
SHA256 校验码
暂无校验码
建议从 GitHub Releases 页面直接下载,并自行核对文件完整性
本平台所有 SHA-256 校验码均提取自项目在 GitHub 官方 Release 页面发布的文件,未做任何修改。你可以通过 GitHub Releases 页面自行验证。
开源透明
查看 GitHub 源码卸载说明
删除 ArchiveBox 数据目录(默认 ~/archivebox)即可完全卸载。如使用 Docker,先运行 docker compose down -v 清理容器和卷。
无额外依赖
下载后即可直接使用,无需安装其他运行环境