一、LM Studio简介

LM Studio是一款本地LLM运行平台，提供类ChatGPT的图形界面，支持GGUF格式模型，GPU加速开箱即用，完全免费。

核心特点

图形界面：类ChatGPT的友好界面

GGUF支持：支持大多数开源模型格式

GPU加速：NVIDIA/AMD/Apple Silicon

本地API：提供OpenAI兼容的本地API

模型下载：内置模型搜索和下载

跨平台：macOS、Linux、Windows

二、安装部署

下载安装

访问 lmstudio.ai

下载对应平台版本

安装并启动

系统要求

组件

最低要求

推荐配置

内存

8GB

16GB+

显卡

4GB显存

8GB+

硬盘

10GB

20GB+

GPU驱动

NVIDIA：安装CUDA驱动
AMD：安装ROCm（Linux/macOS）
Apple Silicon：原生支持

三、使用教程

下载模型

点击左侧"Search"

搜索模型名称（如：llama2、qwen）

选择版本

点击Download

对话界面

顶部选择模型

底部输入消息

按Enter发送

等待生成完成

参数调整

参数

说明

推荐值

Temperature	创造性	0.7

Max Length	最大长度	2048

Top P	采样	0.9

GPU Layers	GPU卸载	越多越好

四、本地API

启动API服务器

点击左侧"Server"

选择模型

点击"Start Server"

默认地址：http://localhost:1234/v1

API调用示例

from openai import OpenAI
client = OpenAI(
    base_url="http://localhost:1234/v1",
    api_key="lm-studio"
)response = client.chat.completions.create(
    model="llama2",
    messages=[{"role": "user", "content": "Hello!"}]
)
print(response.choices[0].message.content)

curl调用

curl http://localhost:1234/v1/chat/completions \
  -H "Content-Type: application/json" \
  -d '{
    "model": "llama2",
    "messages": [{"role": "user", "content": "Hello"}]
  }'

五、模型获取

支持的模型格式

GGUF（推荐）

GPTQ

AWQ

GGML

模型下载来源

Hugging Face

The Bloke

LM Studio内置搜索

六、与Ollama对比

特性	LM Studio	Ollama

界面

图形界面

命令行

API兼容	OpenAI	OpenAI

模型格式	GGUF	原生格式

操作难度

简单

中等

适用用户

普通用户

开发者

LM Studio本地LLM完整指南