CLIR à l’assaut de la Tour de Babel
2 mai 2011
La recherche par mots clés dans les descriptions et revendications de brevets écrits en
chinois, coréen, russe ou portugais devient possible dans PATENTSCOPE sans connaissance de ces
langues.
En juin 2010, l’OMPI lançait la version bêta de son extension
CLIR –
Cross-lingual Information Retrieval – pour PATENTSCOPE : un outil de recherche d’informations
multilingue innovant en 5 langues (allemand, anglais, espagnol, français et japonais) permettant d’
élargir les recherches en matière de brevet.
Moins d’une année après le lancement de cet
outil, le
chinois, coréen, russe et portugais viennent d’être ajoutés. Le coréen, le russe et le portugais
sont encore à un stade expérimental en raison de la complexité de la langue coréenne et d’un corpus
d’entraînement de taille restreinte pour les langues portugaise et russe.
Les améliorations suivantes ont également été apportées:
- Meilleures propositions de synonymes en japonais en mode supervisé.
- Couverture linguistique de l’allemand étendue en utilisant la collection de brevets publiée par l’Office Européen des Brevets (OEB).
Afin d’améliorer la couverture des dictionnaires, l’OMPI recherche des corpus bilingues dans
les paires de langues suivantes : anglais-portugais, anglais-espagnol et anglais-russe. Sont
notamment recherchés tous titres, abrégés, articles scientifiques et brevets parallèles dans
ces combinaisons bilingues, ce qui permettrait d’améliorer considérablement l’
outil CLIR
depuis et vers ces langues.
Votre avis et suggestions pour améliorer l’outil sont les
bienvenus.