FONEM : Un code de transcription phonétique pour la reconstitution automatique des familles saguenayennes

Par Yolande Lavoie, Patrick Brard, Gérard Bouchard
Français

Résumé

Bouchard Gérard, Brard Patrick et Lavoie Yolande. — FONEM : un code de transcription phonétique pour la reconstitution automatique des familles saguenayennes. La nouvelle méthode FONEM retranscrit la structure phonétique des noms propres. Elle ne propose pas une simplification trop poussée de cette structure, comme certains codes plus anciens, et elle tente d'éviter le défaut inverse de divers vocables des noms dont seule l'orthographe diffère. Pour cela, FONEM utilise un ensemble de transformations élémentaires dans lesquelles un groupe de lettres est remplacé par un groupe court, par exemple, toute occurrence de « AUD » ou « AULD » ou « EAUD » en fin de mot est simplement remplacée par « ? ». Plusieurs passages de cet algorithme permettent de simplifier progressivement les noms propres jusqu'à ne conserver que le squelette qui servira aux couplages et reconstitutions automatiques. Des essais préliminaires ont confirmé les bonnes performances de ce nouveau code.

Voir l'article sur Persée