Fiche non validée
Les informations de cette fiche proviennent de sources publiques et n'ont pas encore été validées par l'éditeur. Si vous constatez une erreur, veuillez nous la signaler.
TRL
Par
TRL est une bibliothèque open-source de Hugging Face pour l'entraînement de modèles de langage par renforcement. Elle propose des outils pour le Supervised Fine-Tuning (SFT), le Group Relative Policy Optimization (GRPO), le Direct Preference Optimization (DPO) et la modélisation de récompenses.
Solutions similaires
Kili Technology NLP & LLM Annotation Tool
Par KILI TECHNOLOGY
Kili Technology NLP & LLM Annotation Tool est une plateforme de labellisation de données textuelles pour l'entraînement ...
DC Scope
Par EASYVIRT
DC Scope est une solution de pilotage, d'optimisation et d'analyse des coûts pour infrastructures virtualisées On Prem e...
XBRL Processing Engine (XPE)
Par UB PARTNER
Moteur de traitement XBRL certifié, permettant la validation de documents et taxonomies conformes aux normes XBRL, OIM (...
Direct Transport Compositor (DTC)
Le Direct Transport Compositor (DTC) de SCALABLE GRAPHICS est un logiciel de composition et de gestion de flux vidéo pou...
Data Comply One (plateforme de conformité RGPD, AI Act, NIS2, DORA)
Par MISSION RGPD
Data Comply One est une plateforme SaaS de conformité réglementaire couvrant le RGPD, l'AI Act, NIS2 et DORA. Elle perme...
XBRL Taxonomy Tools
Par UB PARTNER
XBRL Taxonomy Tools est une suite d'outils pour concevoir, réviser et générer des taxonomies XBRL ainsi que des modèles ...