R
    IA Générative

    RLHF

    Définition

    Reinforcement Learning from Human Feedback. Technique d'entraînement où un modèle est affiné grâce aux retours humains pour mieux aligner ses réponses avec les préférences utilisateurs.

    Voir aussi

    Aller plus loin avec hIAppy

    Vous voulez appliquer concrètement RLHF dans votre PME ou ETI ?

    Tous les termes

    Nous utilisons des cookies pour la mesure d'audience et, avec votre accord, pour des fonctionnalités publicitaires. Vous pouvez accepter ou refuser.

    hIAppyen ligne

    Répondre

    hIAppy

    IA • En ligne

    Bonjour ! 👋

    Je suis l'assistant IA de hIAppy. Comment puis-je vous aider à explorer l'IA pour votre entreprise ?