RLHF
Définition
Reinforcement Learning from Human Feedback. Technique d'entraînement où un modèle est affiné grâce aux retours humains pour mieux aligner ses réponses avec les préférences utilisateurs.
Voir aussi
Aller plus loin avec hIAppy
Vous voulez appliquer concrètement RLHF dans votre PME ou ETI ?
- Diagnostic IA hIAppy Vision : on cadre votre cas d'usage en 4 à 6 semaines.
- Prototype IA hIAppy Lab : POC fonctionnel en 5 à 15 jours.
- Formations IA hIAppy Learn : ateliers et formations sur mesure.