使用llama-gguf-split合並deepseek分片文档

字號+ 編輯: 国内TP粉 修訂: 种花家 來源: 原创 2025-03-19 我要說兩句(0)

因爲從hugging face下載gguf文档只能拿到一些分片文档, 在這裡記錄分片文档合並的簡易命令。

從hugging face的頁面中可以找到deepseek的gguf文档列表:

https://huggingface.co/unsloth/DeepSeek-R1-GGUF/tree/main/DeepSeek-R1-Q4_K_M

以筆者下載到的deepseek-r1版本的9個分片文档舉例說明:

文档大小(bytes)文档名

48339779936

DeepSeek-R1-Q4_K_M-00001-of-00009.gguf

49429396320

DeepSeek-R1-Q4_K_M-00002-of-00009.gguf

49527312640

DeepSeek-R1-Q4_K_M-00003-of-00009.gguf

48272509536

DeepSeek-R1-Q4_K_M-00004-of-00009.gguf

49422027488

DeepSeek-R1-Q4_K_M-00005-of-00009.gguf

48272509536

DeepSeek-R1-Q4_K_M-00006-of-00009.gguf

49429396320

DeepSeek-R1-Q4_K_M-00007-of-00009.gguf

4693877369

DeepSeek-R1-Q4_K_M-00008-of-00009.gguf

14798482144

DeepSeek-R1-Q4_K_M-00009-of-00009.gguf

將模型保存到d:\models也就是D盤的models文档夾下, 還需要從github上的llama.cpp庫裡下載到llama分割合並分片文档的程序, 或者自己編譯都行:

https://github.com/ggml-org/llama.cpp/releases

筆者是用windows 11工作站版, 解包得到llama-gguf-split.exe, 解壓到c盤llama文档夾下

那麽開始->運行->cmd到命令行裡輸入

cd d:\models

就會到達模型目錄下, 再用以下格式的命令來合並

c:\llama\llama-gguf-split --merge 第一個分片文档的位置.gguf  合並後的文档名.gguf

舉例說明: 筆者的實際應用場景, 筆者把模型文档被放置到D盤models文档夾下了, 假設我想得到名爲deepseek-r1-q4.gguf完整模型文档作爲合並後文档名, 命令就應該是這樣寫:

c:\llama\llama-gguf-split --merge D:\models\DeepSeek-R1-Q4_K_M-00001-of-00009.gguf deepseek-r1-q4.gguf

報錯相關注意事項:

合並的時候如果内存不足(如果你是用本地小内存電腦處理的)或者是硬盤空間不足,合並過程會報錯,但對於萌新來說無法察覺到,實際運行合並不完整的模型會報文档頭校驗錯誤,無法運行。

閲完此文,您的感想如何?
  • 有用

    38

  • 沒用

    2

  • 開心

    5

  • 憤怒

    2

  • 可憐

    3

1.如文章侵犯了您的版權,請發郵件通知本站,該文章將在24小時内刪除;
2.本站標注原創的文章,轉發時煩請注明來源;
3.交流群: 2702237 13835667

相關課文
  • 通過i參數使用國内鏡像給pip安裝提速

  • Conda刪除不用的虛擬環境

  • flask框架知識點總結

  • linux - centos 7.x安裝python3.10教程

我要說說
網上賓友點評