使用llama-gguf-split合并deepseek分片文件

字号+ 编辑: 国内TP粉 修订: 种花家 来源: 原创 2025-03-19 我要说两句(0)

因为从hugging face下载gguf文件只能拿到一些分片文件, 在这里记录分片文件合并的简易命令。

从hugging face的页面中可以找到deepseek的gguf文件列表:

https://huggingface.co/unsloth/DeepSeek-R1-GGUF/tree/main/DeepSeek-R1-Q4_K_M

以笔者下载到的deepseek-r1版本的9个分片文件举例说明:

文件大小(bytes)文件名

48339779936

DeepSeek-R1-Q4_K_M-00001-of-00009.gguf

49429396320

DeepSeek-R1-Q4_K_M-00002-of-00009.gguf

49527312640

DeepSeek-R1-Q4_K_M-00003-of-00009.gguf

48272509536

DeepSeek-R1-Q4_K_M-00004-of-00009.gguf

49422027488

DeepSeek-R1-Q4_K_M-00005-of-00009.gguf

48272509536

DeepSeek-R1-Q4_K_M-00006-of-00009.gguf

49429396320

DeepSeek-R1-Q4_K_M-00007-of-00009.gguf

4693877369

DeepSeek-R1-Q4_K_M-00008-of-00009.gguf

14798482144

DeepSeek-R1-Q4_K_M-00009-of-00009.gguf

将模型保存到d:\models也就是D盘的models文件夹下, 还需要从github上的llama.cpp库里下载到llama分割合并分片文件的程序, 或者自己编译都行:

https://github.com/ggml-org/llama.cpp/releases

笔者是用windows 11工作站版, 解包得到llama-gguf-split.exe, 解压到c盘llama文件夹下

那么开始->运行->cmd到命令行里输入

cd d:\models

就会到达模型目录下, 再用以下格式的命令来合并

c:\llama\llama-gguf-split --merge 第一个分片文件的位置.gguf  合并后的文件名.gguf

举例说明: 笔者的实际应用场景, 笔者把模型文件被放置到D盘models文件夹下了, 假设我想得到名为deepseek-r1-q4.gguf完整模型文件作为合并后文件名, 命令就应该是这样写:

c:\llama\llama-gguf-split --merge D:\models\DeepSeek-R1-Q4_K_M-00001-of-00009.gguf deepseek-r1-q4.gguf

报错相关注意事项:

合并的时候如果内存不足(如果你是用本地小内存电脑处理的)或者是硬盘空间不足,合并过程会报错,但对于萌新来说无法察觉到,实际运行合并不完整的模型会报文件头校验错误,无法运行。

阅完此文,您的感想如何?
  • 有用

    38

  • 没用

    2

  • 开心

    5

  • 愤怒

    2

  • 可怜

    2

1.如文章侵犯了您的版权,请发邮件通知本站,该文章将在24小时内删除;
2.本站标注原创的文章,转发时烦请注明来源;
3.Q群: 2702237 13835667

相关课文
  • 通过i参数使用国内镜像给pip安装提速

  • Conda删除不用的虚拟环境

  • flask框架知识点总结

  • linux - centos 7.x安装python3.10教程

我要说说
网上嘉宾点评