Informatique
A
abdall ‱ 2 heures, 54 minutes

📌 Limites de dĂ©bit dans Claude

đŸ”č Qu’est-ce qu’une limite de dĂ©bit ?
C’est un mĂ©canisme qui contrĂŽle la quantitĂ© de requĂȘtes ou de tokens que vous pouvez envoyer Ă  l’API Claude sur une pĂ©riode donnĂ©e, afin de prĂ©venir la surcharge du systĂšme.

🧼 Types de limites
1. Limites basĂ©es sur les requĂȘtes
Nombre maximum de requĂȘtes par minute.
Exemple : 1000 requĂȘtes/min.
2. Limites basées sur les tokens
Limite d’entrĂ©e (tokens dans le prompt).
Limite de sortie (tokens dans la réponse).
Limite totale de tokens (entrée + sortie).
⚙ Limites par dĂ©faut (organisations)
Type de limite Valeur par défaut
RequĂȘtes/min 1000
Tokens d’entrĂ©e/min 40 000
Tokens de sortie/min 8 000
Ces limites peuvent ĂȘtre ajustĂ©es selon les besoins de l'organisation.

đŸ§© Limites par espace de travail
Vous pouvez définir des limites personnalisées pour chaque espace de travail.
Utile pour éviter la surutilisation et assurer une répartition équitable des ressources.
Les limites de l'espace de travail doivent ĂȘtre infĂ©rieures ou Ă©gales aux limites de l'organisation.
⚠ Vous ne pouvez pas dĂ©finir de limite sur l’espace de travail par dĂ©faut.

📈 Surveillance dans la Console Claude
La page Usage de la Claude Console permet de visualiser :

Les graphiques d’utilisation des tokens et des requĂȘtes.
Deux graphiques spécifiques :
Rate Limit - Input Tokens : entrées non mises en cache.
Rate Limit - Output Tokens : sorties.
Ces graphiques montrent la marge de croissance, les pics d’utilisation, et les limites actuelles.

🛑 En-tĂȘtes de rĂ©ponse
Lorsque vous faites une requĂȘte, l’API retourne des en-tĂȘtes utiles pour suivre vos limites :

En-tĂȘte ----> Description
1- retry-after----> Temps Ă  attendre avant de Retenter.
2- anthropic-ratelimit-requests-* ----> RequĂȘtes max/remaining/reset
3- anthropic-ratelimit-tokens-* ---->Tokens max/remaining/reset
4- anthropic-ratelimit-input/output-tokens-* ----> Tokens d’entrĂ©e/sortie
anthropic-priority-* ----> Limites prioritaires (si activées)

Les en-tĂȘtes indiquent toujours la limite la plus restrictive active.

🚀 Mode rapide (Fast Mode)
Utilisé avec speed: "fast" sur Opus 4.8, 4.7 ou 4.6.
Des limites de débit spécifiques s'appliquent.
Si dĂ©passĂ©es : erreur 429 + en-tĂȘtes anthropic-fast-*.
đŸ§Ș API Rate Limits
Vous pouvez interroger programmatiquement vos limites via l'API Rate Limits.

✅ Bonnes pratiques
Surveillez réguliÚrement vos limites via la console.
Utilisez le cache pour réduire les tokens consommés.
Définissez des limites par espace de travail pour éviter les surcharges.
Gérez les erreurs 429 avec un mécanisme de retry avec délai.
0
0
Discussions
Connectez-vous pour rejoindre la discussion
Connexion

Aucun commentaire pour l'instant.

I
Informatique

Menu Communauté