从群体到宿主：通过 Docker 化的 Ollama 暴露 LLaMA

使用Ollama在 Docker 容器内轻松部署 LLaMA 模型，并通过端口将其暴露给外部访问11434。

🧰 先决条件

Docker 已安装
LLaMA模型所需的内存和磁盘空间足够
（可选）本地 Ollama CLI 用于在容器外部进行测试

🛠️ 第一步：创建 Dockerfile

FROM ollama/ollama:latest

# Pull the LLaMA model inside the container
RUN ollama pull llama

# Expose default Ollama port
EXPOSE 11434

# Start Ollama server on container startup
CMD ["ollama", "serve", "--port", "11434"]

将其另存为Dockerfile。

🏗️ 第二步：构建 Docker 镜像

docker build -t ollama-llama .

🚀 第三步：运行容器

docker run -d -p 11434:11434 --name ollama-llama-container ollama-llama

这将把 Ollama LLaMA 服务器暴露在外http://localhost:11434。

💬 第四步：与模型互动

使用 HTTP 发送请求或使用ollamaCLI：

curl http://localhost:11434

ollama run llama如果已安装 CLI 并指向此容器，您也可以使用它。

📝 备注

根据需要替换llama为llama2、llama3或特定型号名称。
如果需要持久化模型缓存，请使用卷挂载。
使用以下命令监控容器日志：

docker logs -f ollama-llama-container

📚 资源

文章来源：https://dev.to/moni121189/from-herd-to-host-exusing-llama-via-dockerized-ollama-3hhc

菜单

分享

从群体到宿主：通过 Docker 化的 Ollama 暴露 LLaMA

从群体到宿主：通过 Docker 化的 Ollama 暴露 LLaMA

🧰 先决条件

🛠️ 第一步：创建 Dockerfile

🏗️ 第二步：构建 Docker 镜像

🚀 第三步：运行容器

💬 第四步：与模型互动

📝 备注

📚 资源

系统设计面试中的 19 种微服务模式

使用 React 和 AWS Amplify 实现无服务器架构第三部分：跟踪应用使用情况

模型-视图-控制器（MVC）模式到底是什么？DEV 全球项目展示挑战赛，由 Mux 主办：快来展示你的项目吧！

我在两年内从 PHP 开发人员晋升为高级 C#/.NET 开发人员。

了解 Docker：第 12 部分 – 传递构建参数

Yarn 和第三方 NPM 客户端的黑暗未来 DEV 的全球展示与讲述挑战赛，由 Mux 呈现：展示你的项目！

CSS DEV 的全球展示挑战赛“响应式字体”由 Mux 呈现：展示你的项目！

我是如何以学生开发者的身份免费获得 Tabnine Pro 的，你也可以！

五大顶级JS框架

从 Rector PHP 开始：利用自动化改进您的 PHP 代码