feat: OpenAI-compatible API (#417)

Co-authored-by: Aaron Pham <29749331+aarnphm@users.noreply.github.com> Co-authored-by: pre-commit-ci[bot] <66853113+pre-commit-ci[bot]@users.noreply.github.com>
2026-04-23 16:39:48 -04:00 · 2023-10-07 00:50:03 -04:00
parent b43fabfff8
commit 04bb29a264
11 changed files with 296 additions and 8 deletions
--- a/openllm-python/src/openllm/protocol/init.py
+++ b/openllm-python/src/openllm/protocol/init.py
@@ -0,0 +1,19 @@
+'''Protocol-related packages for all library integrations.
+
+Currently support OpenAI compatible API.
+'''
+from __future__ import annotations
+import os
+import typing as t
+
+from openllm_core.utils import LazyModule
+
+_import_structure: dict[str, list[str]] = {'openai': []}
+
+if t.TYPE_CHECKING:
+  from . import openai as openai
+
+__lazy = LazyModule(__name__, os.path.abspath('__file__'), _import_structure)
+__all__ = __lazy.__all__
+__dir__ = __lazy.__dir__
+__getattr__ = __lazy.__getattr__
--- a/openllm-python/src/openllm/protocol/openai.py
+++ b/openllm-python/src/openllm/protocol/openai.py
@@ -0,0 +1,124 @@
+from __future__ import annotations
+import time
+import typing as t
+
+import attr
+
+import openllm_core
+
+@attr.define
+class CompletionRequest:
+  prompt: str
+  model: str = attr.field(default=None)
+  suffix: t.Optional[str] = attr.field(default=None)
+  max_tokens: t.Optional[int] = attr.field(default=16)
+  temperature: t.Optional[float] = attr.field(default=1.0)
+  top_p: t.Optional[float] = attr.field(default=1)
+  n: t.Optional[int] = attr.field(default=1)
+  stream: t.Optional[bool] = attr.field(default=False)
+  logprobs: t.Optional[int] = attr.field(default=None)
+  echo: t.Optional[bool] = attr.field(default=False)
+  stop: t.Optional[t.Union[str, t.List[str]]] = attr.field(default=None)
+  presence_penalty: t.Optional[float] = attr.field(default=0.0)
+  frequency_penalty: t.Optional[float] = attr.field(default=0.0)
+  best_of: t.Optional[int] = attr.field(default=1)
+  logit_bias: t.Optional[t.Dict[str, float]] = attr.field(default=None)
+  user: t.Optional[str] = attr.field(default=None)
+
+@attr.define
+class ChatCompletionRequest:
+  messages: t.List[t.Dict[str, str]]
+  model: str = attr.field(default=None)
+  functions: t.List[t.Dict[str, str]] = attr.field(default=attr.Factory(list))
+  function_calls: t.List[t.Dict[str, str]] = attr.field(default=attr.Factory(list))
+  temperature: t.Optional[float] = attr.field(default=1.0)
+  top_p: t.Optional[float] = attr.field(default=1)
+  n: t.Optional[int] = attr.field(default=1)
+  stream: t.Optional[bool] = attr.field(default=False)
+  stop: t.Optional[t.Union[str, t.List[str]]] = attr.field(default=None)
+  max_tokens: t.Optional[int] = attr.field(default=None)
+  presence_penalty: t.Optional[float] = attr.field(default=0.0)
+  frequency_penalty: t.Optional[float] = attr.field(default=0.0)
+  logit_bias: t.Optional[t.Dict[str, float]] = attr.field(default=None)
+  user: t.Optional[str] = attr.field(default=None)
+
+@attr.define
+class LogProbs:
+  text_offset: t.List[int] = attr.field(default=attr.Factory(list))
+  token_logprobs: t.List[float] = attr.field(default=attr.Factory(list))
+  tokens: t.List[str] = attr.field(default=attr.Factory(list))
+  top_logprobs: t.List[t.Dict[str, t.Any]] = attr.field(default=attr.Factory(list))
+
+@attr.define
+class CompletionTextChoice:
+  text: str
+  index: int
+  logprobs: LogProbs = attr.field(default=attr.Factory(lambda: LogProbs()))
+  finish_reason: str = attr.field(default=None)
+
+@attr.define
+class Usage:
+  prompt_tokens: int = attr.field(default=0)
+  completion_tokens: int = attr.field(default=0)
+  total_tokens: int = attr.field(default=0)
+
+@attr.define
+class CompletionResponse:
+  choices: t.List[CompletionTextChoice]
+  model: str
+  object: str = 'text_completion'
+  id: str = attr.field(default=attr.Factory(lambda: openllm_core.utils.gen_random_uuid('cmpl')))
+  created: int = attr.field(default=attr.Factory(lambda: int(time.monotonic())))
+  usage: Usage = attr.field(default=attr.Factory(lambda: Usage()))
+
+@attr.define
+class CompletionResponseStream:
+  choices: t.List[CompletionTextChoice]
+  model: str
+  object: str = 'text_completion'
+  id: str = attr.field(default=attr.Factory(lambda: openllm_core.utils.gen_random_uuid('cmpl')))
+  created: int = attr.field(default=attr.Factory(lambda: int(time.monotonic())))
+
+LiteralRole = t.Literal['system', 'user', 'assistant']
+
+class Message(t.TypedDict):
+  role: LiteralRole
+  content: str
+
+@attr.define
+class Delta:
+  role: LiteralRole
+  content: str
+
+@attr.define
+class ChatCompletionChoice:
+  index: int
+  message: Message
+  finish_reason: str = attr.field(default=None)
+
+@attr.define
+class ChatCompletionStreamChoice:
+  index: int
+  delta: Message
+  finish_reason: str = attr.field(default=None)
+
+@attr.define
+class ChatCompletionResponse:
+  choices: t.List[ChatCompletionChoice]
+  model: str
+  object: str = 'chat.completion'
+  id: str = attr.field(default=attr.Factory(lambda: openllm_core.utils.gen_random_uuid('chatcmpl')))
+  created: int = attr.field(default=attr.Factory(lambda: int(time.time())))
+  usage: Usage = attr.field(default=attr.Factory(lambda: Usage()))
+
+@attr.define
+class ChatCompletionResponseStream:
+  choices: t.List[ChatCompletionStreamChoice]
+  model: str
+  object: str = 'chat.completion.chunk'
+  id: str = attr.field(default=attr.Factory(lambda: openllm_core.utils.gen_random_uuid('chatcmpl')))
+  created: int = attr.field(default=attr.Factory(lambda: int(time.time())))
+
+def messages_to_prompt(messages: list[Message]) -> str:
+  formatted = '\n'.join([f"{message['role']}: {message['content']}" for message in messages])
+  return f'{formatted}\nassistant:'