在本地使用 Ollama 运行 LLM 模型

LM Studio 是一个非常适合在个人电脑上进行测试的系统,但如果想要开发更复杂的原型或小型应用程序,则建议考虑使用其他系统:Ollama 就是其中之一。

Ollama 的介绍与功能

Ollama 是一个跨平台引擎,允许在服务器、容器或虚拟机上运行 LLM大型语言模型)。

LM Studio 类似,它支持搜索模型、下载(采用常见的GGUF格式)、运行查询模型。

不同于 LM Studio,它没有直接查询模型的图形界面,但可以安装诸如 OpenWeb UI 这样的独立网页界面。

模型可以通过命令行、Python 库或 HTTP API 进行查询。

安装与配置

Windows 上安装 Ollama,只需从官方网站[1]下载可执行文件并运行即可。即使安装界面无提示关闭,也不代表安装失败。可通过打开命令行执行:ollama –version 来验证安装。

可在 Ollama 官网[1]或其 GitHub 页面[2]查看支持的模型列表。

通过以下命令序列可以下载运行模型:

ollama --version
ollama --help
ollama pull mistral:7b     # 下载模型。
ollama list               # 列出已下载模型。
ollama show mistral:7b    # 查看模型详情。

# 方案1:运行模型并打开交互命令行:
ollama run mistral:7b &

# 方案2:示例查询:
ollama run mistral:7b "什么是太阳黑子?"

Windows 上,执行 Ollama 命令会启动一个后台运行的程序(服务),响应所有模型请求;在 Linux 上,启动守护进程的命令是:

ollama serve

如果服务未自动启动,也可在 Windows 上使用此命令手动启动。

无论如何,Ollama 的服务(守护进程)负责处理所有来自命令行、HTTP 或 Python 库的请求。

与模型的交互方式

总结来说,可以通过三种方式与 Ollama 守护进程交互:

  1. 通过命令行
  2. 通过HTTP API
  3. 使用 Pythonollama 库。

在应用程序中使用 Ollama 时,推荐方法是第三种(Python 库),但也可以通过任何支持 HTTP 请求的编程语言使用第二种方法。

以下是一些HTTP 请求示例:

curl http://localhost:11434/api/version
curl http://localhost:11434/api/tags
curl http://localhost:11434/api/generate -H "Content-Type: application/json" -d '{"model": "mistral","prompt": "解释什么是 Docker", "stream": false}'

以下是一个 Python 代码示例:

# 打印可用模型。
models = ollama.list()["models"]
print("可用模型:")
for model in models:
  print(model['model'])

# 对指定模型进行查询。
response = ollama.chat(
  model='mistral:7b',
  messages=[
  {
    'role': 'user',
    'content': '为什么天空是蓝色?',
  },
])

print("\n💬 模型回答:")
print(response.message.content)

 

总结

虽然LM Studio 是在个人电脑上进行测试的首选方案,Ollama 更适合用于原型开发和简单应用。

对于大规模商业应用,可以考虑其他选项:vLLMllama.cppText Generation Interface (TGI)FastChatOpenLLMDeepSpeed-MIICandle

图片画廊

  1. Ollama 官方网站
  2. Ollama GitHub,包含说明和可用模型列表的仓库。
  3. What is Ollama? Running Local LLMs Made SimpleIBM Technology
  4. Run AI Models Locally with Ollama: Fast & Simple DeploymentIBM Technology
  5. Analysis of Ollama Architecture and Conversation Processing Flow for AI LLM Tool,作者 Rifewang,发表于 Medium
  6. Learn Ollama in 15 Minutes – Run LLM Models Locally for FREE,作者 Tech with Tim,发布于 YouTube
  7. Ollama: 如何在本地电脑上运行 LLM,作者 Simore Rizzo,发布于 YouTube
  8. OpenWeb UI 官方网站
  9. Retrieval Augmented Generation (RAG): 如何使用专门领域数据与 LLM 协作,本站博客。
  10. 如何在本地使用 LM Studio 运行 LLM 模型,本站博客。
  11. 使用 Python 访问 Google Bard / PaLM,本站博客。
  12. 使用 Python 访问 OpenAI ChatGPT,本站博客。

*** 注意:本文是通过 n8n 和 OpenAI 自动流程翻译生成的。

1 year ago

Leave a Reply

Your email address will not be published. Required fields are marked *

评论审核已启用。您的评论可能需要一段时间后才能被显示。