中文 EN
Easy 🌍 Regional Pricing Reliability: High

LM Studio本地LLM完整指南

LM Studio提供类ChatGPT界面,支持GGUF格式模型,GPU加速开箱即用。本文介绍安装配置和使用教程

4.7 (5,600 ratings)
72,000 views Updated 5/18/2024
LM Studio本地部署LLM桌面应用GPU加速GGUF

一、LM Studio简介

LM Studio是一款本地LLM运行平台,提供类ChatGPT的图形界面,支持GGUF格式模型,GPU加速开箱即用,完全免费。

核心特点

  • 图形界面:类ChatGPT的友好界面

  • GGUF支持:支持大多数开源模型格式

  • GPU加速:NVIDIA/AMD/Apple Silicon

  • 本地API:提供OpenAI兼容的本地API

  • 模型下载:内置模型搜索和下载

  • 跨平台:macOS、Linux、Windows
  • 二、安装部署

    下载安装

  • 访问 lmstudio.ai

  • 下载对应平台版本

  • 安装并启动
  • 系统要求

    组件最低要求推荐配置

    内存8GB16GB+

    显卡4GB显存8GB+

    硬盘10GB20GB+

    GPU驱动

    NVIDIA:安装CUDA驱动
    AMD:安装ROCm(Linux/macOS)
    Apple Silicon:原生支持

    三、使用教程

    下载模型

  • 点击左侧"Search"

  • 搜索模型名称(如:llama2、qwen)

  • 选择版本

  • 点击Download
  • 对话界面

  • 顶部选择模型

  • 底部输入消息

  • 按Enter发送

  • 等待生成完成
  • 参数调整

    参数说明推荐值

    Temperature创造性0.7

    Max Length最大长度2048

    Top P采样0.9

    GPU LayersGPU卸载越多越好

    四、本地API

    启动API服务器

  • 点击左侧"Server"

  • 选择模型

  • 点击"Start Server"

  • 默认地址:http://localhost:1234/v1
  • API调用示例

    from openai import OpenAI

    client = OpenAI(
    base_url="http://localhost:1234/v1",
    api_key="lm-studio"
    )

    response = client.chat.completions.create(
    model="llama2",
    messages=[{"role": "user", "content": "Hello!"}]
    )
    print(response.choices[0].message.content)

    curl调用

    curl http://localhost:1234/v1/chat/completions \
    -H "Content-Type: application/json" \
    -d '{
    "model": "llama2",
    "messages": [{"role": "user", "content": "Hello"}]
    }'

    五、模型获取

    支持的模型格式

  • GGUF(推荐)

  • GPTQ

  • AWQ

  • GGML
  • 推荐模型

    模型适用场景硬件需求

    Llama 2 7B日常对话8GB

    Mistral 7B通用任务8GB

    Qwen 14B中文场景16GB

    DeepSeek 33B复杂任务32GB

    模型下载来源

  • Hugging Face

  • The Bloke

  • LM Studio内置搜索
  • 六、与Ollama对比

    特性LM StudioOllama

    界面图形界面命令行

    API兼容OpenAIOpenAI

    模型格式GGUF原生格式

    操作难度简单中等

    适用用户普通用户开发者

    Related Tools

    Found this helpful? Share with your classmates!