Update llama.cpp

2023-09-07 17:34:22 +03:00 · 2023-05-07 00:12:47 -04:00
parent bc853e3742
commit 7c3743fe5f
3 changed files with 9 additions and 5 deletions
--- a/llama_cpp/llama.py
+++ b/llama_cpp/llama.py
@@ -297,21 +297,25 @@ class Llama:
                ctx=self.ctx,
                candidates=llama_cpp.ctypes.pointer(candidates),
                k=top_k,
                min_keep=llama_cpp.c_size_t(1),
            )
            llama_cpp.llama_sample_tail_free(
                ctx=self.ctx,
                candidates=llama_cpp.ctypes.pointer(candidates),
                z=llama_cpp.c_float(1.0),
                min_keep=llama_cpp.c_size_t(1),
            )
            llama_cpp.llama_sample_typical(
                ctx=self.ctx,
                candidates=llama_cpp.ctypes.pointer(candidates),
                p=llama_cpp.c_float(1.0),
                min_keep=llama_cpp.c_size_t(1),
            )
            llama_cpp.llama_sample_top_p(
                ctx=self.ctx,
                candidates=llama_cpp.ctypes.pointer(candidates),
                p=top_p,
                min_keep=llama_cpp.c_size_t(1),
            )
            llama_cpp.llama_sample_temperature(
                ctx=self.ctx,
--- a/llama_cpp/llama_cpp.py
+++ b/llama_cpp/llama_cpp.py
@@ -515,7 +515,7 @@ def llama_sample_top_k(
    ctx: llama_context_p,
    candidates,  # type: _Pointer[llama_token_data_array]
    k: c_int,
-    min_keep: c_size_t = c_size_t(1),
+    min_keep: c_size_t,
 ):
    return _lib.llama_sample_top_k(ctx, candidates, k, min_keep)
@@ -534,7 +534,7 @@ def llama_sample_top_p(
    ctx: llama_context_p,
    candidates,  # type: _Pointer[llama_token_data_array]
    p: c_float,
-    min_keep: c_size_t = c_size_t(1),
+    min_keep: c_size_t,
 ):
    return _lib.llama_sample_top_p(ctx, candidates, p, min_keep)
@@ -553,7 +553,7 @@ def llama_sample_tail_free(
    ctx: llama_context_p,
    candidates,  # type: _Pointer[llama_token_data_array]
    z: c_float,
-    min_keep: c_size_t = c_size_t(1),
+    min_keep: c_size_t,
 ):
    return _lib.llama_sample_tail_free(ctx, candidates, z, min_keep)
@@ -572,7 +572,7 @@ def llama_sample_typical(
    ctx: llama_context_p,
    candidates,  # type: _Pointer[llama_token_data_array]
    p: c_float,
-    min_keep: c_size_t = c_size_t(1),
+    min_keep: c_size_t,
 ):
    return _lib.llama_sample_typical(ctx, candidates, p, min_keep)
--- a/vendor/llama.cpp
+++ b/vendor/llama.cpp