⚠ 前提:确认系统为 JetPack 6.x(基于 Ubuntu 22.04),内核 5.15,预装 CUDA 12.x。运行 jetson_release 确认版本后再继续。
// Step 1 — 确认环境
# 查看 JetPack 版本
jetson_release
# 确认 CUDA 可用
nvcc --version
nvidia-smi
# 确认内存(应显示约 64GB)
free -h
// Step 2 — 安装 Ollama(ARM64 + CUDA 自动识别)
# 一键安装,自动识别 Jetson CUDA 环境
curl -fsSL https://ollama.com/install.sh | sh
# 下载模型
ollama pull gemma4:e2b # 4GB 常驻快速层
ollama pull gemma4:26b-a4b # 20GB 主力生成层 ⭐
# 测试推理
ollama run gemma4:26b-a4b "你好,测试一下推理速度"
// Step 3 — ComfyUI(官方 Jetson Docker 镜像)
# 使用 dustynv 官方镜像,最省事,CUDA 全支持
sudo docker run --runtime nvidia \
--name comfyui \
-p 8188:8188 \
-v ~/comfyui-data:/data \
--restart unless-stopped \
dustynv/comfyui:r36.4.0
# 浏览器访问
# http://jetson-ip:8188
# 模型放置路径
# ~/comfyui-data/models/checkpoints/ ← checkpoint
# ~/comfyui-data/models/loras/ ← LoRA
// Step 4 — Hermes Agent
# 安装依赖
pip3 install hermes-agent --break-system-packages
# 配置连接本地 Ollama
cat > ~/.hermes/config.yaml << 'EOF'
llm:
provider: "ollama"
endpoint: "http://localhost:11434"
model: "gemma4:26b-a4b"
routing:
fast: "gemma4:e2b"
primary: "gemma4:26b-a4b"
EOF
# 后台常驻启动
hermes gateway start --daemon
// Step 5 — 开机自启(systemd)
# Ollama 已自动注册为 systemd 服务
sudo systemctl enable ollama
sudo systemctl start ollama
# ComfyUI Docker 设置为开机自启
sudo docker update --restart unless-stopped comfyui
# Hermes 注册为服务(可选)
sudo systemctl enable hermes