简单 🌍 地区定价
可靠性: 高
LM Studio本地LLM完整指南
LM Studio提供类ChatGPT界面,支持GGUF格式模型,GPU加速开箱即用。本文介绍安装配置和使用教程
4.7 (5,600 条评价)
浏览 72,000 更新于 2024/5/18 LM Studio本地部署LLM桌面应用GPU加速GGUF
一、LM Studio简介
LM Studio是一款本地LLM运行平台,提供类ChatGPT的图形界面,支持GGUF格式模型,GPU加速开箱即用,完全免费。
核心特点
二、安装部署
下载安装
系统要求
| 组件 | 最低要求 | 推荐配置 |
| 内存 | 8GB | 16GB+ |
| 显卡 | 4GB显存 | 8GB+ |
| 硬盘 | 10GB | 20GB+ |
GPU驱动
NVIDIA:安装CUDA驱动
AMD:安装ROCm(Linux/macOS)
Apple Silicon:原生支持
三、使用教程
下载模型
对话界面
参数调整
| 参数 | 说明 | 推荐值 |
| Temperature | 创造性 | 0.7 |
|---|
| Max Length | 最大长度 | 2048 |
|---|
| Top P | 采样 | 0.9 |
|---|
| GPU Layers | GPU卸载 | 越多越好 |
|---|
四、本地API
启动API服务器
API调用示例
from openai import OpenAIclient = OpenAI(
base_url="http://localhost:1234/v1",
api_key="lm-studio"
)
response = client.chat.completions.create(
model="llama2",
messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)
curl调用
curl http://localhost:1234/v1/chat/completions \
-H "Content-Type: application/json" \
-d '{
"model": "llama2",
"messages": [{"role": "user", "content": "Hello"}]
}'
五、模型获取
支持的模型格式
推荐模型
| 模型 | 适用场景 | 硬件需求 |
| Llama 2 7B | 日常对话 | 8GB |
| Mistral 7B | 通用任务 | 8GB |
| Qwen 14B | 中文场景 | 16GB |
| DeepSeek 33B | 复杂任务 | 32GB |
模型下载来源
六、与Ollama对比
| 特性 | LM Studio | Ollama |
|---|
| 界面 | 图形界面 | 命令行 |
| API兼容 | OpenAI | OpenAI |
|---|
| 模型格式 | GGUF | 原生格式 |
|---|
| 操作难度 | 简单 | 中等 |
| 适用用户 | 普通用户 | 开发者 |