Examen del alcance y las implicaciones de las patentes de genes gracias a una mayor transparencia
Resumen del artículo aparecido en un número reciente de la revista Nature Biotechnology titulado “Transparency Tools in Gene Patenting for informing policy and practice”
Por Osmat A. Jefferson, Cambia, Australia y Universidad Tecnológica de Queensland, Brisbane, Australia
En vista de la importancia que ha adquirido el sistema mundial de propiedad intelectual (P.I.) en el mundo y la incidencia que tiene en las vidas de casi todos los ciudadanos del planeta, es fundamental que los medios para entender esos derechos y sus enseñanzas, sus implicaciones y alcance se conviertan en bienes públicos mundiales. Para lograrlo se necesita asegurar la disponibilidad libre y gratuita no solo de los datos primarios en un formato normalizado y reutilizable, sino también de las herramientas, en tanto que bienes públicos, para visualizar, analizar y modelar esos datos, que se ajusten a las diversas necesidades y usos. Es lo que llamamos “transparencia”.
Es preciso asimismo disponer de plataformas abiertas basadas en Internet que permitan a la comunidad agrupar, analizar y examinar estos conocimientos, plataformas que trasciendan las jurisdicciones o las esferas de innovación.
Son estos los imperativos que impulsaron la creación del sistema Lens de Cambia (sistema autónomo de búsqueda de patentes de libre acceso basado en Internet) y en particular, de su aplicación de innovación biológica, de la que forma parte el sistema PatSeq, al que nos referiremos en el presente artículo (véase el recuadro).
Las patentes de genes figuran entre los aspectos más polémicos, opacos y mal comprendidos del sistema actual de P.I. Son cada vez más comunes e importantes las invenciones, productos y servicios que se basan en el conocimiento o en la utilización directa de las secuencias que conforman el material genético, generalmente del ADN, o de las proteínas codificadas por los genes. Asimismo, son cada vez más palpables los temores de la sociedad acerca de la idoneidad de la autorización de patentar esos componentes de los sistemas vivos.
La transparencia en relación con la extensión y el alcance de las invenciones genéticas es un aspecto fundamental y tiene varias funciones importantes. En primer lugar, la transparencia permite a los examinadores entender la invención y determinar si reúne los requisitos de patentamiento. En segundo lugar, posibilita el acceso público, al concepto de la invención, así como su uso, a fin de ejecutar el “acuerdo” en que se basa el sistema de patentes, alentando de ese modo las invenciones de seguimiento y la innovación acumulativa, y reduciendo la duplicación de esfuerzos. En tercer lugar, la trasparencia ofrece a los responsables políticos el fundamento referencial y contextual necesario para comprobar que la práctica de patentamiento es compatible con los objetivos económicos y sociales del sistema de P.I. En cada una de esas funciones esenciales, la práctica de las oficinas de patentes en materia de patentamiento de genes deja mucho que desear.
Las secuencias del ADN y de las proteínas están formadas sea por combinaciones de cuatro letras (A, C, G y T), en el caso del ADN, o bien por 20 tipos de aminoácidos con diferentes propiedades químicas, en el caso de las proteínas. Para comprender su estructura, función y similitudes, se necesitan programas informáticos especializados. Así pues, cuando las secuencias se divulgan en un documento de patente, el examinador o el profesional que lo consulta tiene que usar herramientas de búsqueda, análisis y visualización asistidas por computadora para poder interpretar su valor contextual o significado. Cualquier formato utilizado en el proceso de patentamiento que no facilite el acceso a la información y la búsqueda por computadora – que no sea “legible por máquina”- incumple, a nuestro juicio, los requisitos de divulgación pública del sistema de patentes.
publicación recienteinformamos sobre la creación y disponibilidad de una plataforma abierta y pública, basada en Internet, que podría mejorar sustancialmente la trasparencia en la esfera de las patentes de genes en todo el mundo.
La encuesta internacional que realizamos en 55 oficinas de patentes entre julio y octubre de 2011, que se centraba en las normas y prácticas relativas a la patentabilidad de las secuencias de genes, puso de manifiesto las posibilidades de mejora que existen en lo que atañe a la disponibilidad libre y pública de esos datos para su compilación. Si bien los requisitos de patentabilidad parecían convergir en al menos 35 de las oficinas de patentes que respondieron a la encuesta, la divulgación pública de las secuencias patentadas seguía limitándose a la inspección visual. Son prácticamente inexistentes las aplicaciones abiertas y públicas para la búsqueda y el análisis de los descubrimientos y las invenciones basados en secuencias.
Para remediar esta situación, Cambia ha ampliado la base de datos de secuencias patentadas de búsqueda libre en El Lenspara incluir datos procedentes de 15 jurisdicciones y ha creado una serie de nuevas herramientas para las secuencias patentadas (PatSeq) que permiten la búsqueda de información jurídica y científica en las patentes biológicas relacionadas con un genoma particular. Esas primeras herramientas de búsqueda están enfocadas en las patentes de genes y sus secuencias biológicas divulgadas asociadas con el genoma humano, y ofrecen una plataforma para inventariar, analizar, comentar y compartir esos conocimientos.
Aunque el reciente fallo del Tribunal Supremo de los Estados Unidos sobre los genes del cáncer de mama (Association for Molecular Pathology (AMP) v Myriad Genetics) mantenía que las secuencias que ocurren naturalmente no son patentables en los EE.UU. (véase Repercusiones del caso Myriad para la biotecnología - Revista de la OMPI), isolated genomic sequences are still patentable in many jurisdictions, including in Australia, Canada, Europe and Japan (for an example of a gene patent, check claims 1-3 in the Australian patent AU_686004_B2 at www.lens.org/lens/patent/AU_686004_B2).
Ante la creciente globalización de los mercados y de la innovación, y las diferencias en la política y las prácticas nacionales en materia de patentes, es necesario disponer de conjuntos abiertos de datos normalizados y perfeccionados, mejores normas de cumplimiento, así como herramientas abiertas y compartidas para la toma de decisiones, que fomenten la creación de un entorno normativo favorable a la innovación biológica.
El caso Myriad puso de relieve también la complejidad técnica de los descubrimientos y las invenciones basados en secuencias genómicas, así como la acuciante necesidad de concebir herramientas más precisas para determinar las similitudes en las secuencias divulgadas en las patentes, en especial en la sección de reivindicaciones.
En el ámbito de las patentes de genes, existe una diferencia clara entre la divulgación de las secuencias y su reivindicación. Al presentar una solicitud de patente para una invención biológica, el solicitante debe divulgar todas las secuencias que intervienen en su invención (las que solo se usan como referencias en el documento, las que sustentan la invención o las que constituyen la invención), en una sección aparte, conocida como la sección de listas de secuencias. Una vez que todas esas secuencias se divulgan, es importante contar con herramientas que distingan y destaquen el papel, la función y ubicación de las secuencias divulgadas con respecto a la invención, así como sus similitudes con todas las secuencias divulgadas anteriormente. Sin esos conocimientos técnicos y herramientas explicativas, el público, muchos responsables políticos, innovadores e inversionistas a menudo tienen dificultades para entender la extensión y el alcance de las patentes de genes.
Hemos constatado que, por lo general, muchas secuencias se divulgan pero pocas se reivindican como genes. Cuando se reivindica una secuencia per se, suele tratarse de moléculas aisladas o purificadas en una jurisdicción particular. La reivindicación de una secuencia de gen implica que todos los usos posibles de esa secuencia quedan restringidos y requieren la obtención de una licencia del titular durante la vigencia de la patente o durante la vigencia de la patente en esa jurisdicción. En cambio, si la secuencia se reivindica como parte de una secuencia más larga o como objeto de un método específico, los usos de esa secuencia concreta podrían dejar de ser exclusivos, lo que permitiría que otros inventores tuvieran acceso a ella y la usaran libremente sin necesidad de negociar una licencia. El público y los innovadores deben ser capaces de distinguir claramente entre esos casos para comprender mejor la extensión y el alcance de los derechos concedidos sobre las secuencias de genes, reducir los riesgos de la inversión y propiciar un sistema de innovación, equitativo e incluyente, aunque somos conscientes de la dificultad que eso entraña.
Si bien las grandes oficinas de patentes afirman disponer de bases de datos sofisticadas que abarcan un número considerable de secuencias, muchas veces el público no puede acceder a esas herramientas ni utilizarlas. Por otra parte, numerosas oficinas de patentes que tienen presupuestos limitados o que cubren jurisdicciones con incipientes sistemas de P.I. no tienen acceso a esas posibilidades.
Incluso los proyectos de colaboración extraoficiales, creados para armonizar la divulgación y la disponibilidad de las secuencias patentadas entre países, tienen un alcance limitado. Por ejemplo, el programa de colaboración entre la base de datos DNA Databank of Japan (DDBJ); los archivos European Nucleotide Archives (ENA); y la división GenBank-PAT del Centro Nacional de Información sobre Biotecnología (NCBI) de los Estados Unidos se limita al intercambio de secuencias nucleotídicas de patente, y no ha habido acuerdo formal hasta la fecha para compartir secuencias proteicas de patente. La International Nucleotide Sequence Database Collaboration (INSDC), que reúne esas tres importantes bases de datos públicas, fomenta el intercambio cotidiano de secuencias nucleotídicas de patente. En vista de que las listas de secuencias de solicitudes PCT y de patentes estadounidenses concedidas pueden aparecer duplicadas en esas bases de datos, cada una mantiene un registro ligeramente diferente de las secuencias patentadas. Algunas empresas comerciales alegan tener datos completos y análisis sofisticados, pero esos servicios de acceso a la información son onerosos. Además, incluso esas bases de datos comerciales son incompletas.
Secuencias divulgadas de la patente y el genoma humano
La aplicación biológica de CAMBIA en el sistema Lens ofrece una perspectiva global y bien documentada de la compleja gama de patentes de genes. Esa aplicación posibilita el acopio, el análisis y la visualización de secuencias y de datos de patentes, cuenta con un conjunto de herramientas de búsqueda y localización dinámica de secuencias patentadas asociadas con varios genomas según diversos grados de similitud, y permite comparar el alcance de la patente, comenzando con el genoma humano. Al analizar el alcance de las patentes de los genes conocidos del genoma humano, constatamos que el porcentaje de genes conocidos referenciados, es decir, mencionados en la sección de reivindicaciones de la patente, pero no necesariamente reivindicados, oscilaba entre el 26% y el 62%.
En agosto de 2012, habíamos logrado clasificar 131.339 secuencias nucleotídicas y 15.054 secuencias de aminoácidos de la lista de secuencias, con un grado de homología del 100% respecto del genoma humano. Esas secuencias se mencionaban en las reivindicaciones de 13.985 patentes otorgadas en los Estados Unidos.
Reivindicación y divulgación de las secuencias nucleotídicas
Después de optimizar y ampliar los algoritmos para elegir los documentos de patente que mencionan una secuencia en su reivindicación, empezamos a analizar manualmente las reivindicaciones asociadas únicamente con las 131.339 entradas de secuencias nucleotídicas de correspondencia perfecta (no las secuencias de aminoácidos). Esas entradas se mencionaban en 2.716 patentes. Constatamos que 76.910 de las 131.339 secuencias mostraban una correspondencia excepcional, con un grado de homología del 100% con el genoma humano, y pertenecían a 2.685 patentes. Las 54.429 secuencias restantes se repetían en los documentos de patente duplicados. Según el fallo en el caso Myriad, las secuencias de correspondencia perfecta se considerarían secuencias nucleotídicas naturales del genoma humano y por lo tanto, no podrían patentarse en su versión no modificada.
El análisis de las reivindicaciones en las que se mencionaban esas secuencias excepcionales permitió determinar: que se utilizan estrategias muy variadas para reivindicar una secuencia nucleotídica; que una pequeña proporción de esas secuencias (13%) se reivindica como composición de secuencia (que da derechos exclusivos sobre la utilización de esa secuencia); y que cerca de un tercio de las patentes correspondientes no se mantuvieron hasta el final de su vigencia posible (es decir, 20 años). En otro estudio de las secuencias nucleotídicas reivindicadas y patentadas se indicaba que los institutos públicos y privados tenían percepciones distintas del valor de las patentes de genes y de los modelos para su uso.
El conjunto de herramientas del PatSeq
En el sistema multilingüe Lens, elaboramos una serie de herramientas para la búsqueda de información sobre patentes y secuencias. Por ejemplo, cuando un documento de patente contiene una secuencia divulgada, en la columna de información de la página con los resultados de la búsqueda aparece la estructura helicoidal del ADN en miniatura que alerta a los usuarios sobre su disponibilidad. También hemos introducido una pestaña de secuencias que explica la naturaleza de las secuencias divulgadas en la carpeta de documentos, que permite a los usuarios buscar y filtrar los metadatos (naturaleza de la secuencia, longitud, origen del organismo), siempre que estén disponibles, ubicar la secuencia en el documento y consultar la fuente de datos original (de dónde se ha descargado la secuencia). También creamos las aplicaciones PatSeq Explorer, PatSeq Analyzer y PatSeq Finder que permiten llevar a cabo análisis más profundizados.
PatSeq Explorer posibilita una visualización y búsqueda de nivel múltiple de secuencias patentadas divulgadas, estructuradas según los diversos umbrales de homología con un genoma de referencia, siendo el genoma humano el primer ejemplo disponible. Así, los usuarios pueden estudiar, al nivel del genoma y de los cromosomas, las tendencias generales de patentamiento, filtrar y buscar secuencias y atributos de patentes, y abrir diferentes conjuntos de documentos de patente de la base de datos del sistema Lens, o bien investigar más a fondo y analizar la secuencia a nivel del lugar y del gen (véase la figura 1). Las entradas de las secuencias registradas se pueden visualizar según su ubicación en el documento de patente y su tipo, junto con una ventanita en la que aparece su número y el número de veces que aparecen en los documentos de patente correspondientes en las jurisdicciones en las que las secuencias fueron divulgadas. Todas las consultas pueden incorporarse en blogs y en las páginas de las redes sociales (para alentar la adopción de herramientas bien documentadas) y esperamos que todos los documentos y las colecciones de secuencias puedan descargarse próximamente.
PatSeq Analyzer permite al usuario centrarse en los detalles de una secuencia concreta, consultar y comparar los números de identificación de la secuencia divulgada en uno o en varios documentos de patentes, y analizar los atributos de sus patentes correspondientes en un área concreta del gen. Esta es una versión modificada de una herramienta para la visualización del genoma, remodelada e integrada en el PatSeq Explorer, que se basa en el navegador de mapas de genomas de código abierto (HTML5/SVG), creado por el Instituto de Medicina computacional del Centro de Investigación Príncipe Felipe, de Valencia (España). Todas las consultas del PatSeq Analyzer también se pueden incorporar en otras páginas.
PatSeq Finder permite a los usuarios comparar su propia secuencia con las de las bases de datos de PatSeq y realizar búsquedas según la similitud de las secuencias. Los resultados de las búsquedas se ordenan según el grado de correspondencia con la secuencia de referencia original y se muestra la información relativa a los documentos de patente correspondientes. Los usuarios pueden visualizar las secuencias mencionadas en las reivindicaciones, leer las reivindicaciones de patente correspondientes, examinar los detalles de la alineación, los comentarios sobre la secuencia y captar o descargar los resultados en diferentes formatos.
Resultados de la encuesta en las oficinas de patentes
Prácticamente todas las oficinas de patentes que respondieron al cuestionario de la encuesta indicaron que cumplían con la norma acordada relativa a la divulgación de secuencias asociadas con la presentación de solicitudes de patente (Norma ST.25) que, lamentablemente, no contiene ninguna disposición específica sobre la información legible por máquina. Si bien la mayoría de las oficinas – con excepción de la de Israel – ponen a disposición del público las listas de secuencias, esas listas se pueden consultar principalmente como parte del documento publicado de patente, en formato PDF o imagen, por lo que no son legibles por máquina. Algunas oficinas de patentes, como las del Canadá, Alemania y Hungría, ofrecen en sus sitios web listas de secuencias que pueden buscarse por máquina. Por su parte, el Japón, la OEP y los Estados Unidos, así como, en cierta medida, la República de Corea, ofrecen listas de secuencias que pueden buscarse por máquina a través de proveedores de terceros o mediante archivos descargables electrónicamente desde sus sitios web. Ese servicio suele ser pagadero.
Si bien la encuesta permitió obtener una imagen más fiel del número total de listas de secuencias existentes en algunas jurisdicciones, el ejercicio resultó más difícil en otras, particularmente en las que dependían de la información que les suministraban las oficinas regionales de patentes, como la OEP y la OMPI, o las que no divulgaban el total anual de esas listas de secuencias. Por ejemplo, en los Estados Unidos, país en el que las normas relativas a las secuencias se cumplen con más rigor, constatamos que había varios miles de listas de secuencias mencionadas en las patentes publicadas desde 1990 que no figuraban en la base de datos de la división GenBank–PAT.
El cuestionario permitió confirmar la falta de trasparencia de las herramientas públicas para la búsqueda de patentes de genes. Si bien la decisión judicial en el caso Myriad ha aclarado, en cierta medida, la postura de los Estados Unidos en lo tocante a la reivindicación de secuencias de genes, ese fallo puso también en evidencia la ausencia de análisis matizados y precisos de patentes de genes, tanto a nivel nacional como internacional y, por lo tanto, la necesidad acuciante de realizarlos. Si no se dispone de herramientas de transparencia, el público se encontrará en situación de desventaja, seguirá reinando la incertidumbre, se pondrá en peligro el espíritu empresarial y la inversión, y se seguirá haciendo un uso ineficaz de los recursos para la innovación en la industria y en el sector público en detrimento de la calidad de la formulación de políticas. La aplicación biológica de Cambia en el sistema Lens, en tanto que plataforma pública y abierta, representa la única alternativa válida frente a los servicios comerciales actuales que benefician únicamente a un grupo exclusivo de innovadores en ciencias biológicas.
El autor agradece las contribuciones de los coautores del artículo publicado en Nature Biotech.
Acerca de Cambia
Cambia, que significa cambio, es un instituto independiente sin ánimo de lucro que crea nuevas tecnologías, herramientas y paradigmas para promover el cambio y la innovación. Su misión es democratizar la innovación, creando aplicaciones más equitativas y más incluyentes para resolver problemas mundiales gracias a la ciencia y la tecnología.
El propósito de OMPI Revista es fomentar los conocimientos del público respecto de la propiedad intelectual y la labor que realiza la OMPI, y no constituye un documento oficial de la Organización. Las denominaciones empleadas en esta publicación y la forma en que aparecen presentados los datos que contiene no entrañan, de parte de la OMPI, juicio alguno sobre la condición jurídica de ninguno de los países, territorios o zonas citados o de sus autoridades, ni respecto de la delimitación de sus fronteras o límites. La presente publicación no refleja el punto de vista de los Estados miembros ni el de la Secretaría de la OMPI. Cualquier mención de empresas o productos concretos no implica en ningún caso que la OMPI los apruebe o recomiende con respecto a otros de naturaleza similar que no se mencionen.