A
Apache Airflow
45.3k stars·开发工具·已提供 SHA-256 校验码,下载后可自行核对文件完整性
用于编程方式编写、调度和监控工作流的开源平台。
智能下载
前往项目主页
该项目暂未提供安装包,请直接访问源代码仓库
像写代码一样管理你的数据流程。
核心功能
- 用 Python 定义有向无环图(DAG)来描述工作流
- 强大的调度器,自动处理任务依赖和重试
- 直观的 Web 界面监控流水线运行状态
- 丰富的插件生态,支持各种数据源和工具
避坑指南
- •默认使用 SQLite 仅适合测试,生产环境务必切换为 PostgreSQL 或 MySQL;Python 版本需 ≥3.8;首次学习曲线较陡,建议先阅读官方教程;调度器需要常驻进程,注意资源占用。
适用场景
- 数据 ETL 管道的编排与调度
- 机器学习模型训练和部署流程
- 自动化运维和定时任务管理
Apache Airflow 是一个开源的工作流管理平台,允许你用编程的方式定义、调度和监控工作流。通过将工作流编写为 Python 代码(DAG),它们变得更易维护、可版本控制、可测试和可协作。内置调度器在遵循依赖关系的情况下在 worker 集群上执行任务,而丰富的 UI 提供实时管道可视化、进度跟踪和问题排查。Airflow 高度可扩展(插件机制),广泛应用于数据 ETL、机器学习流程和自动化任务。
标签
workflowscheduleretldata-pipelinepythondag
快速上手
1
2
安装软件
双击下载的安装程序,按提示完成安装
3
步骤1:安装 Python 3.8+ 并执行 pip install apache-airflow
4
步骤2:初始化数据库:airflow db init
5
步骤3:创建管理员用户:airflow users create ...
安装指引
- 步骤1:安装 Python 3.8+ 并执行 pip install apache-airflow
- 步骤2:初始化数据库:airflow db init
- 步骤3:创建管理员用户:airflow users create ...
文件完整性
暂未获取到校验码
该项目暂未在 GitHub Release 页面提供 SHA-256 校验码
SHA256 校验码
暂无校验码
建议从 GitHub Releases 页面直接下载,并自行核对文件完整性
本平台所有 SHA-256 校验码均提取自项目在 GitHub 官方 Release 页面发布的文件,未做任何修改。你可以通过 GitHub Releases 页面自行验证。
开源透明
查看 GitHub 源码运维指引
卸载说明
执行 pip uninstall apache-airflow,然后手动删除数据库文件(默认 ~/airflow/airflow.db)和配置文件(airflow.cfg)。
无额外依赖
下载后即可直接使用,无需安装其他运行环境
遇到问题?查看下方 FAQ
3 FAQs