Conception assistée par l'image appliquée à la reconnaissance des matériaux
Résumé :
MAP - CRAI, Nancy
INTRODUCTION: Ce travail s'inscrit dans la continuité des travaux déjà réalisés dans les différents domaines de recherche par l'image, appliqués à la conception du projet architectural.
Nous étudions ces techniques de recherche d'images par le contenu, afin de concevoir un outil d'assistance par l'image, appliqué à la reconnaissance des différentes textures de matériaux, qui permettront aux intervenants dans le domaine de la conception architecturale, d'intégrer un principe constructif et une option d'analyse et de choix des matériaux.
Mais avant ce préambule, nous allons situer notre travail dans une perspective d'évolution et d'innovation en terme d'outils.
Le reconnaissance des modèles de textures s'appuie sur des images acquises à partir de photos ordinaires prises à moins de cinq mètres. Ces images permettent de définir des indicateurs de reconnaissance des textures. Ces modèles définissent lespoids de chaque classe, et associent une valeur globale de signature à chaque texture analysée.
Pour s'intéresser à l'indexation et à la recherche d'images dans un contexte applicatif, il est commode de subdiviser les bases d'images en deux catégories.
Le première catégorie est celle des bases avec vérité-terrain. Les images de ces bases ont le plus souvent un contenu sémantique homogène. Les applications visées sont généralement professionnelles. Pour indexer de telles images, le concepteur devra intégrer la vérité-terrain définie par l'expert du domaine pour développer un algorithme spécifique, l'objectif étant d'optimiser l'efficacité du système, et sa capacité à répondre aussi bien que l'expert. La recherche d'images dans de telles bases est en fait un problème spécifique de reconnaissance (ex.: pathologie constructive dans le bâtiment, etc...).
La deuxième catégorie regroupe les bases d'images généralement hétérogènes et sans vérité-terrain. Cette fois, l'objectif du système est d'assister l'utilisateur à chercher intelligemment dans une base de connaissances spécifiques un thème particulier en s'adaptant aux besoins subjectifs de chaque utilisateur. Le système cherche donc à être aussi flexible que possible, par exemple, en proposant à l'utilisateur d'affiner sa requête pour un résultat efficient.
Dans les deux cas, un langage de requête par l'image doit permettre à l'utilisateur d'interroger ces bases. On adopte le plus souvent la requête par l'exemple: l'utilisateur fournit ou choisit une image similaire à l'image qu'il recherche. La notion de similarité perceptuelle est donc centrale aux systèmes d'indexation et de recherche d'images par le contenu.
Parmis les nombreuses applications de l'indexation et de la recherche d'images par le contenu, dans le domaine du bâtiment, on peut citer:
- Les applications scientifiques (ex.: pathologies constructives du bâtiment, la recherche spécifique d'un matériau).
- Les applications grand public (ex.: la recherche encyclopédique, etc...).
- L'art, l'éducation (ex.: recherche thématique et encyclopédique illustrée).
Dans les systèmes de recherche par le contenu (Content Based Image Retrieval ou CBIR), le résultat d'une recherche est un ensemble d'images similaires à une image requête plutôt qu'un ensemble d'images répondant exactement aux critères de la recherche. La recherche d'images par le contenu est basée sur la similité des caractéristiques visuelles des images telles que la couleur, latexture ou la forme.
La fonction de distance utilisée pour évaluer la similarité entre images dépend des critères de la recherche, mais également de la représentation des caractéristiques de l'image. L'idée principale est généralement d'associer à chaque image un vecteur multidimensionnel représentant les caractéristiques de l'image, et de mesurer la similarité des images en utilisant une fonction de distance entre les vecteurs. L'image requête est également représentée par un vecteur de caractéristiques et le résultat de la requête retourne toutes les images dont le vecteur a été mis en correspondance avec celui de la requête. La requête devient par conséquent une requête d'intervalle (rang query) de la forme: < Retrouvez les images pour lesquelles la distance entre les vecteurs de caractéristiques et le vecteur de caractéristiques de l'image reqête appartient à un certain intervalle > ou une requête de voisinage (nearest neighbour query) de la forme: <Trouver les K plus proches vecteurs du vecteur de caractéristiques de l'image requête avec un seuil de tolérance donné>, dans un espace multidimensionnel donné ou dans un espace métrique.
A chaque image (Texture) correspond un ensemble d'attributs appelé index ou signature de l'image ou de la texture. Plusieurs systèmes de recherches d'images tel que QBIC ou IKONA, caractérisent les images de textures par une signature globale (ex.: l'histogramme des couleurs de l'image entière). Cependant, pour beaucoup d'applications la caractéristique globale n'offre pas toujours des résultats satisfaisants.