如何本地跑通一个大模型

前言

这里主要借助两个开源项目 ollama 和 openwebui 这两个项目，来尝试本地跑通llama3.1 8b 、 mistral-nemo 12b 和 qwen2 7b 这些模型，再大的模型机器也撑不住了，机器配置如下：

CPU： M2 Max

内存：32 GB

内容

ollama：https://ollama.com/

ollama GitHub：https://github.com/ollama/ollama

ollama Models：https://ollama.com/library

openwebui：https://openwebui.com/

openwebui GitHub：https://github.com/open-webui/open-webui

安装ollama

访问 ollama 网站，根据自身的平台来下载应用，下载后正常安装即可，安装完成后运行命令来拉取模型，模型可访问 ollama Models 选择相应的模型后，会有对应的命令，终端执行即可。

## llama3.1
$ ollama run llama3.1:8b

## qwen2.5
$ ollama run qwen2.5:7b

## mistral-nemo
$ ollama run mistral-nemo:12b

安装openwebui

因为我的 ollama 是在本地的，所以我这里直接基于 docker 来运行 openwebui，运行命令如下：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

运行成功后，我们访问 127.0.0.1:3000 即可打开本地的聊窗口，创建好对应的账号登录后，访问界面如下：

2024-09-23T09:55:13.png

总结

总的来说，现在基于开源的项目，我们能够很快的搭建一个自己本地使用的模型，当前如果你不存在数据安全的问题，使用国内或国外的最新的大模型体验肯定更好。

尝试跑了下llama3.1 70b的模型，跑起来后内存直线飙升，32GB内存的机器不建议尝试跑70b

posted @ 2024-09-23 17:55:39 王洋阅读(46251) 评论(0)

发表评论

昵称

邮箱

网址

大模型——如何本地跑通一个大模型

如何本地跑通一个大模型

前言

内容

安装ollama

安装openwebui

总结

搜索

最新随笔

随笔分类

随笔档案

我的标签

阅读排行榜

推荐排行榜

评论排行榜

最新评论