llmfit 是一款开源 Rust CLI/TUI 工具,自动检测硬件配置(RAM/CPU/GPU/VRAM),从 206 个模型中智能推荐能稳定运行且速度理想的本地大模型。支持 Ollama、llama.cpp、MLX 等多后端,21.3k Stars,性能极快。

💡 痛点:选模型比用模型还难

你有没有经历过这种绝望?

兴冲冲拉了一个 40GB 的模型下来满怀期待,结果跑起来一秒一个 token 生成速度慢得像蜗牛?或者直接报显存不足 OOM,连启动的机会都没有?问题不在模型,也不在硬件——而是你根本不知道手上的机器能跑什么模型。

以前解决这个靠「玄学」:看 Reddit 经验帖、翻测评博客、问 Discord 群友,全靠别人试过的经验。但每个人的硬件不一样,配置不一样,场景也不一样——那些经验放到你机器上可能完全不适用。

llmfit 就是来解决这个问题的。


🤖 llmfit 是什么?

llmfit 是一个开源的 Rust CLI/TUI 工具,由 Alex Jones 开发,核心只有一个问题:「我的硬件能跑哪些本地大模型?哪些能跑得很好?」

它的工作方式很简单:

1. 自动检测你机器的 RAM / CPU / GPU / VRAM(支持多显卡)
2. 内置 206 个模型的硬件需求数据库(HuggingFace 模型为主)
3. 根据你的硬件配置动态计算量化级别和推理速度
4. 给出「能跑」和「能跑好」的推荐列表

21.3k Stars,GitHub 上增长最快的本地 AI 开发者工具之一。Rust 编写,性能碾压 Python 脚本。


⭐ 核心功能

1. 硬件自动检测

一条命令 llmfit system 就能看到自己机器的全部硬件信息:内存、显存、CPU 型号、显卡型号,甚至支持多显卡并行。不用再自己查配置或者记不住显卡的具体参数。

2. 模型智能推荐

# 推荐适合编程场景的模型
llmfit recommend --use-case coding

# 推荐适合日常聊天的模型
llmfit recommend --use-case chat

# 只推荐能完美跑动的(零卡顿)
llmfit recommend --perfect -n 5

推荐结果包含模型名称、量化级别、预计生成速度、需要的显存,一目了然。

3. 多后端支持

llmfit 不挑食,主流本地推理后端全支持:

后端说明
Ollama最流行的本地模型运行工具
llama.cpp纯 C/C++ 高性能推理
MLXApple Silicon 专用优化
Docker Model RunnerDocker 容器化运行
LM Studio桌面端模型管理

4. 硬件规划模式

如果你还没买硬件,或者在考虑升级,llmfit plan --context 可以帮你估算指定模型需要什么配置:

llmfit plan --context "我想要跑 70B 的模型用于编程"
# 输出:建议配置、显存需求、可行方案

5. TUI 交互界面

直接运行 llmfit 打开图形界面,支持键盘导航、过滤搜索、社区排行榜对比,还能直接下载模型到选定的后端。


📥 安装使用

uv 一键安装(推荐)

uv tool install -U llmfit

或者直接运行(不安装)

uvx llmfit

Docker 快速体验

# 输出 JSON 格式推荐
docker run ghcr.io/alexsjones/llmfit recommend --use-case coding | jq '.models[].name'

# Podman 也可以
podman run ghcr.io/alexsjones/llmfit

从源码编译

git clone https://github.com/AlexsJones/llmfit
cd llmfit
cargo build --release
# 二进制文件在 target/release/llmfit

📥 下载地址:


🎯 适用场景

本地 AI 开发者 — 如果你在自己机器上跑 LLM,llmfit 能帮你快速找到最佳性价比模型,不用一次次试错浪费硬盘空间和时间。

配置选购参考 —想买新电脑或加显卡,先用 llmfit plan 模拟一下目标配置,看需要多少显存才够。

多模型对比 — 同个场景(比如编程),在多款 8B 模型之间犹豫,直接看推荐分数和预计速度,一目了然。

Apple Silicon 用户 — MLX 后端专门优化过 Mac M 系列芯片的内存分配,llmfit 能给出针对性的量化建议。


⚠️ 注意事项

  1. 数据库更新 — 内置的 206 个模型数据库会随 HuggingFace 新模型持续更新,运行 llmfit update 可以拉取最新数据。
  2. 模型量化认知有限 — 目前数据库以 HuggingFace 模型为主,部分自定义微调模型可能不在库中。
  3. Windows 支持较弱 — 主要面向 Linux/macOS 开发环境,Windows 上部分 GPU 检测功能可能受限。
  4. 速度预估仅供参考 — 推理速度受多种因素影响,实际体验可能与估算有偏差。
  5. 需要 Rust 工具链 — 从源码编译需要安装 Rust(推荐用 rustup)。

✅ 总结

llmfit 解决了一个很实在的问题:选模型这件事,终于不用靠玄学了

21.3k Stars 说明它在社区里已经被广泛认可。Rust 编写、性能极快、支持多后端多显卡、还有 TUI 图形界面——这些都让模型选择变得前所未有的简单。

如果你在本地跑 LLM,这个工具值得一试。唯一希望改进的就是 Windows 体验和更多第三方模型的覆盖。

推荐指数:⭐⭐⭐⭐⭐(5/5)
适合人群:所有在本地跑 LLM 的开发者,尤其是有多显卡或 Mac M 系列芯片的开发者