Chat Completions

Créez un Chat Completion à l’aide de l’endpoint /chat/completions. Cet endpoint suit le format OpenAI pour l’envoi de messages et la réception de réponses.

Prérequis

Pour créer un Chat Completion, fournissez :

l’URL de base du service Inférence : https://api.inference.wandb.ai/v1
votre clé API W&B : <your-api-key>
Facultatif : votre équipe W&B et votre projet : <your-team>/<your-project>
l’ID d’un modèle parmi les modèles disponibles

Exemples de requêtes

Python
Bash

import openai

client = openai.OpenAI(
    # L'URL de base personnalisée pointe vers W&B Inference
    base_url='https://api.inference.wandb.ai/v1',

    # Créez une clé API sur https://wandb.ai/settings
    # Pour plus de sécurité, il est préférable de la définir dans l'environnement sous OPENAI_API_KEY
    api_key="<your-api-key>",

    # Facultatif : équipe et projet pour le suivi de l'utilisation
    project="<your-team>/<your-project>",
)

# Remplacez <model-id> par n'importe quel ID de modèle de la liste des modèles disponibles
response = client.chat.completions.create(
    model="<model-id>",
    messages=[
        {"role": "system", "content": "<your-system-prompt>"},
        {"role": "user", "content": "<your-prompt>"}
    ],
)

print(response.choices[0].message.content)

curl https://api.inference.wandb.ai/v1/chat/completions \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer <your-api-key>" \
  -H "OpenAI-Project: <your-team>/<your-project>" \
  -d '{
    "model": "<model-id>",
    "messages": [
      { "role": "system", "content": "You are a helpful assistant." },
      { "role": "user", "content": "Tell me a joke." }
    ]
  }'

Format de réponse

L’API renvoie des réponses dans un format compatible avec OpenAI :

{
  "id": "chatcmpl-...",
  "object": "chat.completion",
  "created": 1234567890,
  "model": "meta-llama/Llama-3.1-8B-Instruct",
  "choices": [
    {
      "index": 0,
      "message": {
        "role": "assistant",
        "content": "Here's a joke for you..."
      },
      "finish_reason": "stop"
    }
  ],
  "usage": {
    "prompt_tokens": 25,
    "completion_tokens": 50,
    "total_tokens": 75
  }
}

W&B Models

W&B Weave

Serverless Inference

W&B Training

Prérequis

Exemples de requêtes

Format de réponse

W&B Models

W&B Weave

Serverless Inference

W&B Training

Documentation Index

​Prérequis

​Exemples de requêtes

​Format de réponse

Prérequis

Exemples de requêtes

Format de réponse