LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2026-06-21 23:29:04 -04:00

Files

Ettore Di Giacinto e49ea0123b feat(llama.cpp): add flash_attention and no_kv_offloading (#2310 )

feat(llama.cpp): add flash_attn and no_kv_offload

Signed-off-by: Ettore Di Giacinto <mudler@localai.io>

2024-05-13 19:07:51 +02:00

CMakeLists.txt

2024-02-21 17:23:38 +01:00

grpc-server.cpp

2024-05-13 19:07:51 +02:00

json.hpp

2023-11-11 13:14:59 +01:00

Makefile

2024-05-10 15:08:08 +02:00

prepare.sh

2024-05-04 17:56:12 +02:00

utils.hpp

2024-02-01 19:21:52 +01:00