LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2026-07-30 09:57:57 -04:00

Author	SHA1	Message	Date
Ettore Di Giacinto	30bf8d41d7	[test] upstream validation https://github.com/ggml-org/llama.cpp/issues/15936 Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-11 14:03:26 +02:00
LocalAI [bot]	0de75519dc	chore: ⬆️ Update leejet/stable-diffusion.cpp to `b0179181069254389ccad604e44f17a2c25b4094` (#6246 ) ⬆️ Update leejet/stable-diffusion.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-10 23:43:12 +02:00
Richard Palethorpe	37f5e4f5c1	feat(whisper): Add diarization (tinydiarize) (#6184 ) Signed-off-by: Richard Palethorpe <io@richiejp.com>	2025-09-10 19:09:28 +02:00
Ettore Di Giacinto	ffa934b959	feat(chatterbox): add MPS, and CPU, pin version (#6242 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-09 17:58:07 +02:00
Ettore Di Giacinto	d9e25af7b5	feat(nvidia-gpu): bump images to cuda 12.8 (#6239 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-09 13:02:17 +02:00
LocalAI [bot]	8d47309695	chore: ⬆️ Update ggml-org/whisper.cpp to `edea8a9c3cf0eb7676dcdb604991eb2f95c3d984` (#6237 ) ⬆️ Update ggml-org/whisper.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-09 00:20:31 +02:00
LocalAI [bot]	5f6fc02a55	chore: ⬆️ Update leejet/stable-diffusion.cpp to `abb115cd021fc2beed826604ed1a479b6a77671c` (#6236 ) ⬆️ Update leejet/stable-diffusion.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-09 00:20:03 +02:00
LocalAI [bot]	08432d49e5	chore: ⬆️ Update ggml-org/llama.cpp to `3976dfbe00f02a62c0deca32c46138e4f0ca81d8` (#6214 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-08 08:33:33 +02:00
LocalAI [bot]	e51e2aacb9	chore: ⬆️ Update leejet/stable-diffusion.cpp to `c648001030d4c2cc7c851fdaf509ee36d642dc99` (#6215 ) ⬆️ Update leejet/stable-diffusion.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-07 21:04:02 +00:00
Richard Palethorpe	9c3d85fc28	chore: ⬆️ Update leejet/stable-diffusion.cpp to d7f430cd693f2e12ecbaa0ce881746cf305c3b1f (#6213 ) * ⬆️ Update leejet/stable-diffusion.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> * fix(stablediffusion-ggml): Use new sample_params_t Signed-off-by: Richard Palethorpe <io@richiejp.com> --------- Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Signed-off-by: Richard Palethorpe <io@richiejp.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-07 16:34:45 +02:00
LocalAI [bot]	59af928379	chore: ⬆️ Update ggml-org/llama.cpp to `c4df49a42d396bdf7344501813e7de53bc9e7bb3` (#6209 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-06 21:05:07 +00:00
LocalAI [bot]	dbc2bb561b	chore: ⬆️ Update ggml-org/llama.cpp to `408ff524b40baf4f51a81d42a9828200dd4fcb6b` (#6207 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-06 09:09:57 +02:00
LocalAI [bot]	c72c85dcac	chore: ⬆️ Update ggml-org/whisper.cpp to `bb0e1fc60f26a707cabf724edcf7cfcab2a269b6` (#6203 ) ⬆️ Update ggml-org/whisper.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-06 09:08:34 +02:00
LocalAI [bot]	1956681d4c	chore: ⬆️ Update ggml-org/llama.cpp to `fb15d649ed14ab447eeab911e0c9d21e35fb243e` (#6202 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-05 08:42:50 +02:00
LocalAI [bot]	df625e366a	chore: ⬆️ Update leejet/stable-diffusion.cpp to `2eb3845df5675a71565d5a9e13b7bad0881fafcd` (#6192 ) ⬆️ Update leejet/stable-diffusion.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-04 07:35:58 +02:00
LocalAI [bot]	9e6685ac9c	chore: ⬆️ Update ggml-org/llama.cpp to `0fce7a1248b74148c1eb0d368b7e18e8bcb96809` (#6193 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-04 07:35:28 +02:00
LocalAI [bot]	d82922786a	chore: ⬆️ Update ggml-org/llama.cpp to `3de008208b9b8a33f49f979097a99b4d59e6e521` (#6185 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-02 21:07:53 +00:00
LocalAI [bot]	4330fdce33	chore: ⬆️ Update ggml-org/llama.cpp to `d4d8dbe383e8b9600cbe8b42016e3a4529b51219` (#6172 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-02 09:12:03 +02:00
LocalAI [bot]	d4d6a56a4f	chore: ⬆️ Update leejet/stable-diffusion.cpp to `4c6475f9176bf99271ccf5a2817b30a490b83db0` (#6171 ) ⬆️ Update leejet/stable-diffusion.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-01 23:25:12 +02:00
Ettore Di Giacinto	2900a601a0	chore(backends): add stablediffusion-ggml and whisper for metal (#6173 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-09-01 22:30:35 +02:00
Richard Palethorpe	976c159fdb	chore(ci): Build some Go based backends on Darwin (#6164 ) * chore(ci): Build Go based backends on Darwin Signed-off-by: Richard Palethorpe <io@richiejp.com> * chore(stablediffusion-ggml): Fixes for building on Darwin Signed-off-by: Richard Palethorpe <io@richiejp.com> * chore(whisper): Build on Darwin Signed-off-by: Richard Palethorpe <io@richiejp.com> --------- Signed-off-by: Richard Palethorpe <io@richiejp.com>	2025-09-01 22:18:30 +02:00
LocalAI [bot]	969922ffec	chore: ⬆️ Update ggml-org/llama.cpp to `e92d53b29e393fc4c0f9f1f7c3fe651be8d36faa` (#6169 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-09-01 08:06:54 +00:00
Ettore Di Giacinto	739573e41b	feat(flash_attention): set auto for flash_attention in llama.cpp (#6168 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-31 17:59:09 +02:00
LocalAI [bot]	dbdf2908ad	chore: ⬆️ Update ggml-org/llama.cpp to `3d16b29c3bb1ec816ac0e782f20d169097063919` (#6165 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-29 21:14:03 +00:00
LocalAI [bot]	723f01c87e	chore: ⬆️ Update ggml-org/llama.cpp to `c97dc093912ad014f6d22743ede0d4d7fd82365a` (#6163 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-28 21:16:18 +00:00
Richard Palethorpe	e6ebfd3ba1	feat(whisper-cpp): Convert to Purego and add VAD (#6087 ) * fix(ci): Avoid matching wrong backend with the same prefix Signed-off-by: Richard Palethorpe <io@richiejp.com> * chore(whisper): Use Purego and enable VAD This replaces the Whisper CGO bindings with our own Purego based module to make compilation easier. In addition this allows VAD models to be loaded by Whisper. There is not much benefit now except that the same backend can be used for VAD and transcription. Depending on upstream we may also be able to use GPU for VAD in the future, but presently it is disabled. Signed-off-by: Richard Palethorpe <io@richiejp.com> --------- Signed-off-by: Richard Palethorpe <io@richiejp.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-28 17:25:18 +02:00
Ettore Di Giacinto	ead00a28b9	Add 'optimum-quanto' to requirements Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-28 13:32:03 +02:00
Ettore Di Giacinto	9621edb4c5	feat(diffusers): add support for wan2.2 (#6153 ) * feat(diffusers): add support for wan2.2 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(ci): use ttl.sh for PRs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add ftfy deps Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Revert "chore(ci): use ttl.sh for PRs" This reverts commit `c9fc3ecf28`. * Simplify Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore: do not pin torch/torchvision on cuda12 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-28 10:26:42 +02:00
Ettore Di Giacinto	7ce92f0646	fix: select portable environment if detected (#6158 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-28 10:00:54 +02:00
LocalAI [bot]	6a4ab3c1e0	chore: ⬆️ Update ggml-org/llama.cpp to `fbef0fad7a7c765939f6c9e322fa05cd52cf0c15` (#6155 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-27 21:09:34 +00:00
LocalAI [bot]	21faa4114b	chore: ⬆️ Update ggml-org/llama.cpp to `8b696861364360770e9f61a3422d32941a477824` (#6151 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-26 22:07:38 +00:00
Ettore Di Giacinto	e35ad56602	chore(docs): add backends README Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-26 19:39:05 +02:00
Ettore Di Giacinto	3be8b2d8e1	chore(refactor): cli -> cmd, update docs (#6148 ) * chore(refactor): cli -> cmd Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Update README Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-26 19:07:10 +02:00
Ettore Di Giacinto	3c3f477854	feat(mlx-audio): Add mlx-audio backend (#6138 ) * feat(mlx-audio): Add mlx-audio backend Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * improve loading Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * CI tests Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: set C_INCLUDE_PATH to point to python install Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-26 15:27:06 +02:00
LocalAI [bot]	0fc88b3cdf	chore: ⬆️ Update ggml-org/llama.cpp to `c4e9239064a564de7b94ee2b401ae907235a8fca` (#6139 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-26 12:18:58 +02:00
LocalAI [bot]	1a0d06f3db	chore: ⬆️ Update ggml-org/llama.cpp to `043fb27d3808766d8ea8195bbd12359727264402` (#6137 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-25 08:57:09 +02:00
LocalAI [bot]	5e1a8b3621	chore: ⬆️ Update ggml-org/whisper.cpp to `7745fcf32846006128f16de429cfe1677c963b30` (#6136 ) ⬆️ Update ggml-org/whisper.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-24 21:12:13 +00:00
Ettore Di Giacinto	960e51e527	chore(diffusers): support both src and reference_images in diffusers (#6135 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-24 22:03:08 +02:00
Ettore Di Giacinto	195aa22e77	chore(docs): update list of supported backends (#6134 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-24 20:09:19 +02:00
Ettore Di Giacinto	ff5d2dc8be	Revert "fix(rfdetr): use cpu torch for cpu builds" (#6131 ) Revert "fix(rfdetr): use cpu torch for cpu builds (#6129)" This reverts commit `fec8a36b36`.	2025-08-24 11:41:08 +02:00
Ettore Di Giacinto	fec8a36b36	fix(rfdetr): use cpu torch for cpu builds (#6129 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-24 10:17:25 +02:00
Ettore Di Giacinto	5d4f5d2355	feat(backends): add CPU variant for diffusers backend (#6128 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-24 10:17:10 +02:00
LocalAI [bot]	057248008f	chore: ⬆️ Update ggml-org/llama.cpp to `710dfc465a68f7443b87d9f792cffba00ed739fe` (#6126 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-24 08:41:39 +02:00
Ettore Di Giacinto	9f2c9cd691	feat(llama.cpp): Add gfx1201 support (#6125 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-08-23 23:06:01 +02:00
Ettore Di Giacinto	6971f71a6c	Add mlx-vlm (#6119 ) * Add mlx-vlm Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add to CI workflows Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add requirements-mps.txt Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-23 23:05:30 +02:00
Ettore Di Giacinto	1ba66d00f5	feat: bundle python inside backends (#6123 ) * feat(backends): bundle python Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * test ci Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * vllm on self-hosted Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add clang Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Try to fix it for Mac * Relocate links only when is portable Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Make sure to call macosPortableEnv Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use self-hosted for vllm Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-23 22:36:39 +02:00
Ettore Di Giacinto	259383cf5e	chore(deps): bump llama.cpp to '45363632cbd593537d541e81b600242e0b3d47fc' (#6122 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-23 08:39:10 +02:00
Ettore Di Giacinto	0fd395d6ec	feat(diffusers): add MPS version (#6121 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-22 23:14:54 +02:00
Ettore Di Giacinto	1d830ce7dd	feat(mlx): add mlx backend (#6049 ) * chore: allow to install with pip Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * WIP Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Make the backend to build and actually work Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * List models from system only Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add script to build darwin python backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Run protogen in libbackend Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Detect if mps is available across python backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * CI: try to build backend Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Debug CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Index mlx-vlm Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Remove mlx-vlm Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop CI test Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-08-22 08:42:29 +02:00
LocalAI [bot]	6dccfb09f8	chore: ⬆️ Update ggml-org/llama.cpp to `cd36b5e5c7fed2a3ac671dd542d579ca40b48b54` (#6118 ) ⬆️ Update ggml-org/llama.cpp Signed-off-by: github-actions[bot] <41898282+github-actions[bot]@users.noreply.github.com> Co-authored-by: mudler <2420543+mudler@users.noreply.github.com>	2025-08-22 07:57:27 +02:00

1 2 3 4 5 ...

605 Commits