Question 1

Quelle température utiliser pour un chatbot ?

Accepted Answer

Pour un chatbot de support client, utilisez une température entre 0 et 0.3 pour des réponses fiables et cohérentes. Pour un chatbot créatif ou conversationnel, une température entre 0.5 et 0.8 apporte plus de variété tout en restant pertinent.

Question 2

Une température à 0 donne-t-elle toujours la même réponse ?

Accepted Answer

Presque. À température 0, le modèle choisit systématiquement le token le plus probable, ce qui rend la sortie quasi déterministe. De légères variations peuvent subsister selon l'implémentation et le batching, mais en pratique les réponses sont très reproductibles.

Question 3

La température augmente-t-elle les hallucinations ?

Accepted Answer

Une température élevée augmente effectivement le risque d'hallucination, car le modèle sélectionne davantage de tokens moins probables, ce qui peut conduire à des associations de mots incohérentes ou des faits inventés. Pour les tâches factuelles, préférez une température basse.

Question 4

C'est quoi la température d'un LLM ?

Accepted Answer

La température d'un LLM est un paramètre qui contrôle le degré d'aléatoire lors de la génération de texte. Une valeur basse (proche de 0) rend les réponses prévisibles et factuelles, tandis qu'une valeur haute (proche de 1 ou au-delà) produit des réponses plus variées et créatives. Ce réglage influence directement la distribution de probabilité des tokens candidats.

Question 5

Quelle est la différence entre température et top-p ?

Accepted Answer

La température modifie l'ensemble de la distribution de probabilité des tokens en la rendant plus ou moins uniforme. Le top-p (nucleus sampling) filtre les tokens en ne conservant que ceux dont la probabilité cumulée atteint un certain seuil. Les deux contrôlent la diversité des réponses, mais par des mécanismes différents. La plupart des fournisseurs recommandent d'ajuster l'un ou l'autre, pas les deux simultanément.

Cas d’usage	Température	Raison
Extraction de données	0	Précision maximale, pas de variation
Résumé factuel	0 - 0.2	Fidélité au texte source
Chatbot support	0.1 - 0.3	Réponses fiables et cohérentes
Rédaction de contenu	0.5 - 0.7	Bon équilibre créativité/pertinence
Brainstorming	0.8 - 1.2	Exploration maximale des idées
Écriture créative	0.9 - 1.5	Originalité et surprises textuelles

Température (paramètre LLM)

Qu’est-ce que la température d’un LLM ?

Comment fonctionne la température techniquement ?

Impact concret sur les réponses

Exemple avec la question : “Quel est le meilleur langage de programmation ?”

Valeurs recommandées par cas d’usage

Température vs Top-p (nucleus sampling)

Bonnes pratiques

Termes associés

Questions fréquentes

Un email concret. Chaque mardi.