Propiedad intelectual Formación en PI Divulgación de la PI La PI para... La PI y… La PI en… Información sobre patentes y tecnología Información sobre marcas Información sobre diseños industriales Información sobre las indicaciones geográficas Información sobre las variedades vegetales (UPOV) Leyes, tratados y sentencias de PI Recursos de PI Informes sobre PI Protección por patente Protección de las marcas Protección de diseños industriales Protección de las indicaciones geográficas Protección de las variedades vegetales (UPOV) Solución de controversias en materia de PI Soluciones operativas para las oficinas de PI Pagar por servicios de PI Negociación y toma de decisiones Cooperación para el desarrollo Apoyo a la innovación Colaboraciones público-privadas La Organización Trabajar con la OMPI Rendición de cuentas Patentes Marcas Diseños industriales Indicaciones geográficas Derecho de autor Secretos comerciales Academia de la OMPI Talleres y seminarios Día Mundial de la PI Revista de la OMPI Sensibilización Casos prácticos y casos de éxito Novedades sobre la PI Premios de la OMPI Empresas Universidades Pueblos indígenas Judicatura Recursos genéticos, conocimientos tradicionales y expresiones culturales tradicionales Economía Igualdad de género Salud mundial Cambio climático Política de competencia Objetivos de Desarrollo Sostenible Observancia de los derechos Tecnologías de vanguardia Aplicaciones móviles Deportes Turismo PATENTSCOPE Análisis de patentes Clasificación Internacional de Patentes ARDI - Investigación para la innovación ASPI - Información especializada sobre patentes Base Mundial de Datos sobre Marcas Madrid Monitor Base de datos Artículo 6ter Express Clasificación de Niza Clasificación de Viena Base Mundial de Datos sobre Dibujos y Modelos Boletín de Dibujos y Modelos Internacionales Base de datos Hague Express Clasificación de Locarno Base de datos Lisbon Express Base Mundial de Datos sobre Marcas para indicaciones geográficas Base de datos de variedades vegetales PLUTO Base de datos GENIE Tratados administrados por la OMPI WIPO Lex: leyes, tratados y sentencias de PI Normas técnicas de la OMPI Estadísticas de PI WIPO Pearl (terminología) Publicaciones de la OMPI Perfiles nacionales sobre PI Centro de Conocimiento de la OMPI Informes de la OMPI sobre tendencias tecnológicas Índice Mundial de Innovación Informe mundial sobre la propiedad intelectual PCT - El sistema internacional de patentes ePCT Budapest - El Sistema internacional de depósito de microorganismos Madrid - El sistema internacional de marcas eMadrid Artículo 6ter (escudos de armas, banderas, emblemas de Estado) La Haya - Sistema internacional de diseños eHague Lisboa - Sistema internacional de indicaciones geográficas eLisbon UPOV PRISMA Mediación Arbitraje Determinación de expertos Disputas sobre nombres de dominio Acceso centralizado a la búsqueda y el examen (CASE) Servicio de acceso digital (DAS) WIPO Pay Cuenta corriente en la OMPI Asambleas de la OMPI Comités permanentes Calendario de reuniones Documentos oficiales de la OMPI Agenda para el Desarrollo Asistencia técnica Instituciones de formación en PI Apoyo para COVID-19 Estrategias nacionales de PI Asesoramiento sobre políticas y legislación Centro de cooperación Centros de apoyo a la tecnología y la innovación (CATI) Transferencia de tecnología Programa de Asistencia a los Inventores (PAI) WIPO GREEN PAT-INFORMED de la OMPI Consorcio de Libros Accesibles Consorcio de la OMPI para los Creadores WIPO ALERT Estados miembros Observadores Director general Actividades por unidad Oficinas en el exterior Ofertas de empleo Adquisiciones Resultados y presupuesto Información financiera Supervisión

Una ayuda para mejorar la traducción automática de documentos de patentes

4 de agosto de 2011

La OMPI se complace en presentar a la comunidad científica y de I+D un nuevo producto de datos lingüísticos que contribuirá a mejorar la calidad de los sistemas de traducción automática para documentos de patentes.
 
El Corpus de Solicitudes de Patentes Paralelas (Coppa), de PATENTSCOPE, ofrece, a partir de los datos procedentes de PATENTSCOPE, la base de datos internacional de documentos de patentes de la OMPI, un “corpus” bilingüe de más de 8 millones de segmentos paralelos de texto en inglés y francés que abarcan más de 170 millones de palabras.  Véanse los detalles técnicos aquí. En el futuro se añadirán más pares de lenguas si la OMPI puede disponer de los datos de origen asociados en cantidad suficiente y de los derechos de redistribución necesarios.
 
La disponibilidad, en un formato fácil de utilizar para el usuario, de este vasto corpus será de gran utilidad para aquellas iniciativas que tienen como finalidad diseñar unos sistemas de traducción automática más fieles para textos de patentes. A su vez, unos mejores sistemas de traducción automática reducirán las barreras lingüísticas a las que se enfrentan inventores y oficinas de patentes. Además, unos sistemas de traducción automática más fieles redundarán en la eficacia del sistema internacional de patentes, así como en la accesibilidad al patrimonio global de información tecnológica ahí contenido.
 
Los segmentos paralelos se obtuvieron dividiendo en frases los resúmenes y títulos de veinte años de solicitudes internacionales de patentes presentadas de acuerdo con el PCT (desde 1990 hasta 2010), y buscando a continuación estas frases en las versiones traducidas por profesionales expertos en la traducción de patentes. El producto final es una mina de oro para la investigación en el ámbito lingüístico, en especial para la extracción de terminología, la creación de memorias de traducción y la investigación en el terreno de la traducción automática.
 
La OMPI pone, sin coste alguno, el Corpus a disposición de instituciones académicas y centros privados de investigación que deseen servirse de él únicamente con fines de investigación. A cambio, estas instituciones se comprometen a compartir con la OMPI los resultados publicados. Los interesados en utilizar el producto con fines distintos a los de la investigación académica pueden hacerse con él por 2.000 francos suizos, y están sujetos a una política de no redistribución.