DXOMARK est le leader mondial dans le développement d'outils et de méthodes d'évaluation de la qualité des dispositifs multimédias. Nous équipons et conseillons les plus grandes marques pour qu'elles puissent évaluer scientifiquement les performances des appareils photo, de l'audio, de l'écran et de la batterie des produits de demain. De la Silicon Valley à l’Asie de l’Est, nos équipes partagent leur expertise avec les fabricants pour les aider à développer des produits plus performants. L’excellence au service de la qualité !
Depuis plus de 20 ans, la division Camera évalue et teste appareils photo professionnels, smartphones, caméras de sécurité, drones, automobiles, etc.. Les appareils photo tels que les smartphones disposent de pipelines complexes qui s'adaptent au contenu de la scène, rendant les mesures en laboratoire insuffisantes pour une évaluation complète de la camera. Des équipes d'experts en Qualité d'Image sont chargés chez tous les fabricants, d'effectuer des évaluations perceptuelles d'images de scènes naturelles. Ce processus est très chronophage. IQE expérimente l'utilisation de l'apprentissage automatique pour les automatiser.
MISSION
L'iQA (Image Quality Assessment) est l'estimation automatique de la qualité d'une image, autrement dit, de la capacité des caméras à reproduire un contenu de qualité. La perception humaine servant de référence, ces méthodes doivent évaluer différentes caractéristiques perceptuelles de la représentation de l'image telles que la reproduction des couleurs, le rendu du bruit, la représentation de la texture, etc.
L'équipe de Machine Learning travaille sur des outils permettant d'automatiser l'évaluation de la qualité d'image de caméras de smartphones. Le stage proposé se concentre sur une technologie appelée modèles de langage multimodaux de grande taille. Ces modèles sont capables de comprendre à la fois du texte (comme des descriptions ou des données) et des images. Le projet consiste à voir comment ces modèles peuvent aider à prédire la qualité des images, c'est-à-dire déterminer si une photo est nette, bien exposée, ou fidèle aux couleurs, par exemple.
Le projet du stage proposé consiste à étudier la capacité de nouveaux modèles de langage multimodaux de grande taille à traiter la prédiction de la qualité d’image. Le stagiaire devra entraîner ces modèles à partir de bases de données, comprenant des images et des descriptions associées, pour les adapter aux besoins spécifiques de DXOMARK. Le stagiaire devra affiner les LMMs généraux sur des bases de données publiques et internes en suivant des techniques comme QAlign (https://openreview.net/forum?id=PHjkVjR78A).
PROFIL
Stage de 5-6 mois basé à Boulogne-Billancourt à partir de Q1 2025
Last updated on Dec 3, 2024
Boulogne-Billancourt, Île-de-France
·30+ days ago
30+ days ago