Génération de texte sous contraintes pour mesurer des performances de lecture : Une nouvelle approche basée sur les diagrammes de décisions multivalués

auteurs

  • Bonlarron Alexandre
  • Calabrese Aurelie
  • Kornprobst Pierre
  • Régin Jean-Charles

mots-clés

  • Génération de texte
  • Texte standardisé
  • Tests de lecture
  • Test MNREAD
  • Basse vision
  • Diagrammes de décisions multivalués MDD
  • Contraintes

type de document

POSTER

résumé

Mesurer les performances de lecture est l’une des méthodes les plus utilisées en clinique ophtalmologique pour juger de l’efficacité des traitements, des procédures chirurgicales ou des techniques de rééducation. Cependant, l’utilisation des tests de lecture est limitée par le faible nombre de textes standardisés disponibles. Pour le test MNREAD, qui est l’un des tests de référence pris comme exemple dans ce papier, il ne comporte que deux jeux de 19 phrases en français. Ces phrases sont difficiles à écrire car elles doivent respecter des règles de différentes natures (e.g., liées à la grammaire, la longueur, le lexique et l’affichage). Ils sont aussi difficile à trouver : Sur un échantillon de plus de trois millions de phrases issues d’ouvrages de la littérature jeunesse, seulement quatre satisfont les critères du test de lecture MNREAD. Pour obtenir davantage de phrases, nous proposons une approche originale de génération de texte qui prenne en compte l’ensemble des règles dès la génération. Notre approche est basée sur les Multi-valued Decision Diagrams (MDD). Nous représentons le corpus par des n-grammes et les différentes règles par des MDD, puis nous les combinons à l’aide d’opérateurs, notamment des intersections. Les résultats obtenus montrent que cette approche est prometteuse, même si certains problèmes demeurent comme la consommation mémoire ou la validation a posteriori du sens des phrases. En 5-gramme, nous engendrons plus de 4000 phrases qui respectent les critères MNREAD et proposons ainsi facilement une extension d’un jeu de 19 phrases au test MNREAD.

article PDF

plus d'information