hparams : move vocab params to llama_vocab #11159

ggerganov · 2025-01-09T14:55:49Z

Deduplicate vocab size parameters. We used to store the vocab size both in llama_hparams and in llama_vocab. It makes more sense this information to be available only in llama_vocab.

ggml-ci

* llama : functions -> methods (#11110) * llama : add struct llama_vocab to the API (#11156) ggml-ci * hparams : move vocab params to llama_vocab (#11159) ggml-ci * vocab : more pimpl (#11165) ggml-ci * vocab : minor tokenization optimizations (#11160) ggml-ci Co-authored-by: Diego Devesa <slarengh@gmail.com> * lora : update API names (#11167) ggml-ci * llama : update API names to use correct prefix (#11174) * llama : update API names to use correct prefix ggml-ci * cont ggml-ci * cont ggml-ci * minor [no ci] * vocab : llama_vocab_add_[be]os -> llama_vocab_get_add_[be]os (#11174) ggml-ci * vocab : llama_vocab_n_vocab -> llama_vocab_n_tokens (#11174) ggml-ci --------- Co-authored-by: Diego Devesa <slarengh@gmail.com>

* llama : functions -> methods (ggml-org#11110) * llama : add struct llama_vocab to the API (ggml-org#11156) ggml-ci * hparams : move vocab params to llama_vocab (ggml-org#11159) ggml-ci * vocab : more pimpl (ggml-org#11165) ggml-ci * vocab : minor tokenization optimizations (ggml-org#11160) ggml-ci Co-authored-by: Diego Devesa <slarengh@gmail.com> * lora : update API names (ggml-org#11167) ggml-ci * llama : update API names to use correct prefix (ggml-org#11174) * llama : update API names to use correct prefix ggml-ci * cont ggml-ci * cont ggml-ci * minor [no ci] * vocab : llama_vocab_add_[be]os -> llama_vocab_get_add_[be]os (ggml-org#11174) ggml-ci * vocab : llama_vocab_n_vocab -> llama_vocab_n_tokens (ggml-org#11174) ggml-ci --------- Co-authored-by: Diego Devesa <slarengh@gmail.com>

danbev approved these changes Jan 9, 2025

View reviewed changes

ggerganov force-pushed the gg/llama-refactor-9 branch from 98fce56 to 543fd01 Compare January 9, 2025 18:16

ggerganov mentioned this pull request Jan 9, 2025

vocab : more pimpl #11165

Merged

ggerganov added 2 commits January 10, 2025 10:29

hparams : move vocab params to llama_vocab (#11159)

c67e985

ggml-ci

vocab : more pimpl (#11165)

7ecf2aa

ggml-ci

ggerganov force-pushed the gg/llama-refactor-9 branch from 7f65050 to 7ecf2aa Compare January 10, 2025 08:30

ggerganov merged commit 06ae9ae into gg/llama-refactor-8 Jan 10, 2025
52 of 54 checks passed

ggerganov added a commit that referenced this pull request Jan 10, 2025

hparams : move vocab params to llama_vocab (#11159)

1f95cf7

ggml-ci

ggerganov deleted the gg/llama-refactor-9 branch January 10, 2025 08:59

ggerganov added a commit that referenced this pull request Jan 10, 2025

hparams : move vocab params to llama_vocab (#11159)

446fec5

ggml-ci

ggerganov added a commit that referenced this pull request Jan 10, 2025

hparams : move vocab params to llama_vocab (#11159)

7694cec

ggml-ci

ggerganov added a commit that referenced this pull request Jan 10, 2025

hparams : move vocab params to llama_vocab (#11159)

45aab64

ggml-ci

ggerganov mentioned this pull request Jan 11, 2025

llama : add llama_vocab, functions -> methods, naming #11110

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

hparams : move vocab params to llama_vocab #11159

hparams : move vocab params to llama_vocab #11159

ggerganov commented Jan 9, 2025 •

edited

Loading

hparams : move vocab params to llama_vocab #11159

hparams : move vocab params to llama_vocab #11159

Conversation

ggerganov commented Jan 9, 2025 • edited Loading

ggerganov commented Jan 9, 2025 •

edited

Loading