Fiche non validée
Les informations de cette fiche proviennent de sources publiques et n'ont pas encore été validées par l'éditeur. Si vous constatez une erreur, veuillez nous la signaler.
MoshiVis
Par KYUTAI
MoshiVis est un modèle de vision et de parole (VSM) open-source qui étend le modèle Moshi pour permettre des conversations naturelles et en temps réel à propos d'images. Il utilise des modules d'adaptation légers et un mécanisme de gating pour intégrer des informations visuelles tout en conservant les capacités conversationnelles de Moshi.
Éditeur / Prestataire
- Entreprise
- KYUTAI
- SIREN
- 923956916
- Code NAF
- 72.19Z - Recherche-développement en autres sciences physiques et naturelles
- Site web
- kyutai.org/
Souveraineté
Solutions similaires
Transformers
Par
Transformers est une bibliothèque open-source de Hugging Face qui fournit des modèles pré-entraînés et des outils pour l...
VR Link
VR Link est un logiciel de réalité virtuelle conçu pour la visualisation et la collaboration sur des données 3D. Il perm...
Mobiteach
Par XPERTEAM
Mobiteach est une plateforme d'animation de formation en ligne et en présentiel. Elle permet aux formateurs de créer et ...
CADIC SERVICES
Par CADIC SERVICES
Nous proposons donc des solutions logicielles performantes adapt‚es aux besoins de nos clients et … leurs exigences : Ca...
Pitchy Solutions
Par PITCHY BROS PROD
Pitchy Solutions est un logiciel en ligne de création vidéo professionnelle destiné aux entreprises. Il permet de réalis...
Veeton AI Video Generator
Par VEETON
Veeton AI Video Generator est un outil de création vidéo basé sur l'intelligence artificielle, spécialisé dans la mode. ...