OpenSource-Hub
O

omlx

SHA-256
13.8k stars·AI 生产力·已提供 SHA-256 校验码,下载后可自行核对文件完整性

专为 Mac 优化的 LLM 推理引擎,支持连续批处理和智能缓存,菜单栏一键管理。

Mac上本地跑大模型的最顺手工具,菜单栏控制,缓存智能。

核心功能

  • 菜单栏直接管控模型加载/卸载/切换
  • 热-冷两级 KV 缓存:常用内容存内存,冷门存硬盘,重启不丢
  • 连续批处理:高效处理多个同时请求
  • 多模型共跑:文本、视觉、嵌入模型一台服务器搞定
  • 每个模型独立配置:别名、超时、固定加载等

避坑指南

  • 仅支持 Apple Silicon(M1/M2/M3/M4),需要 macOS 15.0+ (Sequoia)。不支持 NVIDIA GPU 或 Intel Mac。首次运行需下载模型,请确保磁盘空间充足。

适用场景

  • 在 MacBook 上本地运行开源大模型,保护隐私
  • 配合 Claude Code、Cursor 等工具加速编码
  • 无网环境或低延迟要求的 AI 推理场景

oMLX 是为 Apple Silicon Mac 量身打造的本地大模型推理引擎。它通过菜单栏或 Web 后台让你轻松加载和管理多个 AI 模型(文本、视觉、嵌入)。核心创新是“热-冷”两级 KV 缓存:常用上下文留在内存,不活跃的内容自动存到 SSD,甚至重启服务器也能恢复。结合连续批处理技术,能高效处理多路并发请求。应用自动识别模型文件夹,支持为每个模型单独配置(超时时间、固定加载、别名),还能适配 Claude Code 等工具。完全离线运行,无需云端依赖。

标签

LLMMacApple Silicon推理引擎KV缓存本地AI菜单栏管理多模型

快速上手

1

下载安装包

点击上方按钮下载对应系统的安装包

2

安装软件

打开下载的 dmg 文件,将应用拖入 Applications 文件夹

3

从 Releases 下载 .dmg 文件,拖入 Applications 文件夹

4

启动 oMLX,按欢迎向导设置模型目录并启动服务器

5

选择并下载第一个模型,开始使用(默认端口 8000)

安装指引
  1. 从 Releases 下载 .dmg 文件,拖入 Applications 文件夹
  2. 启动 oMLX,按欢迎向导设置模型目录并启动服务器
  3. 选择并下载第一个模型,开始使用(默认端口 8000)
文件完整性

已提供 SHA-256 校验码,下载后可自行核对文件完整性

该校验码提取自 GitHub 官方 Release 页面

SHA256 校验码

803d999247af13bc778ce623db6ef539266a82e35ccd984a80a40b0dc2a45114

该校验码提取自 GitHub Release 页面,下载后请自行核对文件完整性

本平台所有 SHA-256 校验码均提取自项目在 GitHub 官方 Release 页面发布的文件,未做任何修改。你可以通过 GitHub Releases 页面自行验证。

运维指引

卸载说明

从 Applications 删除 oMLX.app,再删除 ~/.omlx 文件夹(清除模型和配置)。

无额外依赖

下载后即可直接使用,无需安装其他运行环境

项目信息
开源协议Apache 2.0
最后更新2026-06-26 04:45:32
GitHub 仓库官方网站

遇到问题?查看下方 FAQ

4 FAQs

相似推荐