llmfit 是一款开源 Rust CLI/TUI 工具,自动检测硬件配置(RAM/CPU/GPU/VRAM),从 206 个模型中智能推荐能稳定运行且速度理想的本地大模型。支持 Ollama、llama.cpp、MLX 等多后端,21.3k Stars,性能极快。
💡 痛点:选模型比用模型还难
你有没有经历过这种绝望?
兴冲冲拉了一个 40GB 的模型下来满怀期待,结果跑起来一秒一个 token 生成速度慢得像蜗牛?或者直接报显存不足 OOM,连启动的机会都没有?问题不在模型,也不在硬件——而是你根本不知道手上的机器能跑什么模型。
以前解决这个靠「玄学」:看 Reddit 经验帖、翻测评博客、问 Discord 群友,全靠别人试过的经验。但每个人的硬件不一样,配置不一样,场景也不一样——那些经验放到你机器上可能完全不适用。
llmfit 就是来解决这个问题的。
🤖 llmfit 是什么?
llmfit 是一个开源的 Rust CLI/TUI 工具,由 Alex Jones 开发,核心只有一个问题:「我的硬件能跑哪些本地大模型?哪些能跑得很好?」
它的工作方式很简单:
1. 自动检测你机器的 RAM / CPU / GPU / VRAM(支持多显卡)
2. 内置 206 个模型的硬件需求数据库(HuggingFace 模型为主)
3. 根据你的硬件配置动态计算量化级别和推理速度
4. 给出「能跑」和「能跑好」的推荐列表21.3k Stars,GitHub 上增长最快的本地 AI 开发者工具之一。Rust 编写,性能碾压 Python 脚本。
⭐ 核心功能
1. 硬件自动检测
一条命令 llmfit system 就能看到自己机器的全部硬件信息:内存、显存、CPU 型号、显卡型号,甚至支持多显卡并行。不用再自己查配置或者记不住显卡的具体参数。
2. 模型智能推荐
# 推荐适合编程场景的模型
llmfit recommend --use-case coding
# 推荐适合日常聊天的模型
llmfit recommend --use-case chat
# 只推荐能完美跑动的(零卡顿)
llmfit recommend --perfect -n 5推荐结果包含模型名称、量化级别、预计生成速度、需要的显存,一目了然。
3. 多后端支持
llmfit 不挑食,主流本地推理后端全支持:
| 后端 | 说明 |
|---|---|
| Ollama | 最流行的本地模型运行工具 |
| llama.cpp | 纯 C/C++ 高性能推理 |
| MLX | Apple Silicon 专用优化 |
| Docker Model Runner | Docker 容器化运行 |
| LM Studio | 桌面端模型管理 |
4. 硬件规划模式
如果你还没买硬件,或者在考虑升级,llmfit plan --context 可以帮你估算指定模型需要什么配置:
llmfit plan --context "我想要跑 70B 的模型用于编程"
# 输出:建议配置、显存需求、可行方案5. TUI 交互界面
直接运行 llmfit 打开图形界面,支持键盘导航、过滤搜索、社区排行榜对比,还能直接下载模型到选定的后端。
📥 安装使用
uv 一键安装(推荐):
uv tool install -U llmfit或者直接运行(不安装):
uvx llmfitDocker 快速体验:
# 输出 JSON 格式推荐
docker run ghcr.io/alexsjones/llmfit recommend --use-case coding | jq '.models[].name'
# Podman 也可以
podman run ghcr.io/alexsjones/llmfit从源码编译:
git clone https://github.com/AlexsJones/llmfit
cd llmfit
cargo build --release
# 二进制文件在 target/release/llmfit📥 下载地址:
- GitHub:https://github.com/AlexsJones/llmfit
- 官网:https://www.llmfit.org
- Docker 镜像:
ghcr.io/alexsjones/llmfit
🎯 适用场景
本地 AI 开发者 — 如果你在自己机器上跑 LLM,llmfit 能帮你快速找到最佳性价比模型,不用一次次试错浪费硬盘空间和时间。
配置选购参考 —想买新电脑或加显卡,先用 llmfit plan 模拟一下目标配置,看需要多少显存才够。
多模型对比 — 同个场景(比如编程),在多款 8B 模型之间犹豫,直接看推荐分数和预计速度,一目了然。
Apple Silicon 用户 — MLX 后端专门优化过 Mac M 系列芯片的内存分配,llmfit 能给出针对性的量化建议。
⚠️ 注意事项
- 数据库更新 — 内置的 206 个模型数据库会随 HuggingFace 新模型持续更新,运行
llmfit update可以拉取最新数据。 - 模型量化认知有限 — 目前数据库以 HuggingFace 模型为主,部分自定义微调模型可能不在库中。
- Windows 支持较弱 — 主要面向 Linux/macOS 开发环境,Windows 上部分 GPU 检测功能可能受限。
- 速度预估仅供参考 — 推理速度受多种因素影响,实际体验可能与估算有偏差。
- 需要 Rust 工具链 — 从源码编译需要安装 Rust(推荐用 rustup)。
✅ 总结
llmfit 解决了一个很实在的问题:选模型这件事,终于不用靠玄学了。
21.3k Stars 说明它在社区里已经被广泛认可。Rust 编写、性能极快、支持多后端多显卡、还有 TUI 图形界面——这些都让模型选择变得前所未有的简单。
如果你在本地跑 LLM,这个工具值得一试。唯一希望改进的就是 Windows 体验和更多第三方模型的覆盖。
推荐指数:⭐⭐⭐⭐⭐(5/5)
适合人群:所有在本地跑 LLM 的开发者,尤其是有多显卡或 Mac M 系列芯片的开发者