Neue Derwent Markush-Resource jetzt auf STN® verfügbar

Auf der neuen STN-Plattform ist jetzt nach umfassender Neuentwicklung die Datenbank „Derwent Markush Resource“ für die Suche und Auswertung von chemischen Markush-Strukturen in Patenten neu implementiert.

Mit der Bereitstellung der Derwent Markush-Resource (DWPIM) von Thomson Reuters in einer neu entwickelten Suchumgebung hat FIZ Karlsruhe einen wichtigen Kundenwunsch aus der Chemie- und Pharmabranche realisiert. Die Datenbank DWPIM umfasst mehr als 1,9 Mio. generische chemische Strukturen und sie ergänzt das vorhandene Patentangebot von STN® um einen wesentlichen Bereich zur Chemieinformation. In Kooperation mit der Firma InfoChem aus München wurde eine Markush-Suchmaschine entwickelt, die auf die Daten der Derwent Markush Resource Datenbank abgestimmt ist und die gleichzeitig die STN Konventionen berücksichtigt.


Markush-Suchen sind sehr komplex

Eine Markush-Struktursuche bereitzustellen, ist eine große Herausforderung: Einerseits sind Markush-Suchen sehr komplex und aufwändig zu prozessieren, andererseits sind die damit verbundenen Kundenwünsche und -erwartungen sehr anspruchsvoll. Um die oftmals enorme Komplexität von Markush-Strukturen zu erfassen, müssen besonders leistungsfähige und hochentwickelte Suchprozesse durchgeführt werden, die wiederum auf umfangreiche und komplexe Datenbanken zurückgreifen.


Markush-Strukturen in Patenten

Ein Markush-Patent beschreibt eine Erfindung, die aus einer chemischen Kernstruktur und ihren variablen chemischen Anhängen (Substituenten) besteht. Durch Kombination der Kernstruktur mit wechselnden Anhängen ergeben sich viele „Abkömmlinge“ der Kernstruktur. Der Erfinder möchte sich mit dem Markush-Patent die Kernstruktur und ihre möglichen Varianten sichern.

 

Wenn man von einer Markush-Datenbank spricht, dann versteht man darunter eine chemische Datenbank, deren Datensätze jedoch nicht aus einzelnen Verbindungen (Strukturen) bestehen, sondern aus einer großen Anzahl von Kernstrukturen zusammen mit den chemischen Varianten.


Abb. 1: Basis-Molekülstruktur

Der Begriff Markush-Strukturen umfasst generische chemische Strukturen, also eine Zusammenfassung von einer Kernstruktur zusammen mit allen Varianten, die der Anwender schützen möchte. Sie enthalten Platzhalter für bestimmte Varianten (Substituenten): z. B. R für organische Reste oder X für Halogene (Fluor, Chlor, Brom, Jod).

 

Auf diese Weise kann eine Markush-Struktur sehr viele Einzelstrukturen zusammenfassen. In der abgebildeten Markush-Struktur besitzen die Platzhalter R und X jeweils zwei verschiedene Substituenten, sodass insgesamt vier mögliche Einzelstrukturen in einer Formel repräsentiert werden.

Abb. 2: Patentierte Markush-Struktur
Abb. 3: Daraus abgeleitete Struktur für Atorvastatin, Bildquelle: https://de.wikipedia.org/wiki/Atorvastatin

Markush-Strukturen werden sehr häufig in Patenten vor allem aus dem chemischen und pharmazeutischen Bereich verwendet, um eine möglichst große Zahl an ähnlichen chemischen Verbindungen mit einem Schlag abzudecken und somit zu beanspruchen.

 

In der Praxis sind Markush-Strukturen noch viel komplizierter aufgebaut als in Exkurs 1 gezeigt und können einen sehr großen chemischen Strukturraum abdecken. Darunter befinden sich oftmals sehr wertvolle Verbindungen, die z. B. als Wirkstoffe in Medikamenten dienen. Ein anschauliches Beispiel ist die chemische Struktur des Arzneistoffes Atorvastatin (Handelsname Sortis® in Europa und Lipitor® in den USA), einem der wirtschaftlich erfolgreichsten Medikamente der letzten Jahre. Die chemische Struktur von Atorvastatin ist erstmals in einem Patent (Basisschutz in Europa: EP0247633B1) über eine Markush-Struktur beansprucht worden.

 

Das Auffinden solcher besonderen Einzelverbindungen innerhalb einer Markush-Formel gleicht oftmals der Suche nach der Nadel im Heuhaufen. Die qualifizierte Markush-Suchmaschine  ermöglicht Informationsspezialisten genaues und zielgerichtetes Suchen von chemischen Strukturen in der DWPIM-Datenbank.

 

Dieses Beispiel verdeutlicht, wie wichtig es ist, frühzeitig ausführliche Markush-Struktursuchen bei Patentrecherchen zu berücksichtigen.

Abb. 4: Markush-Suchstruktur, Ak: Alkylkette, z. B. Propan; Cb: Carbocyclus, z. B. Benzol
Abb. 5: Anzeige einer assemblierten Hitstruktur

In STN stehen dem Nutzer insgesamt drei verschiedene Display-Typen zur Verfügung, die sich in der Detailtiefe der gezeigten Markush-Struktur unterscheiden. Während das Full Display die komplette Information zur Markush-Struktur mit allen möglichen Variationen liefert, ermöglicht das sogenannte assemblierte Display eine besonders schnelle Bewertung der Ergebnisse.

 

Das Ergebnis dieser Markush-Suche liefert eine durch die Software assemblierte Hitstruktur inklusive farblicher Hervorhebung der suchrelevanten Strukturteile. Wie am nachfolgenden Beispiel zu sehen, ist somit ein schneller Relevanzabgleich zwischen gesuchter Struktur und gefundener Struktur möglich.


Markush-Strukturen recherchierbar machen

Aufgrund der inhärenten Komplexität vieler Markush-Strukturen ist es kaum möglich sie vollständig in spezifische Einzelverbindungen zu übersetzen. Das liegt zum einen daran, dass die Zahl der enthaltenen Einzelverbindungen sehr groß sein kann, zum anderen aber auch an der Tatsache, dass bestimmte Platzhalter in den Markush-Strukturen keine geschlossene Menge an Einzelverbindungen beschreiben sondern offen sind, d. h. es können jederzeit neue Einzelverbindungen hinzukommen. Um Markush-Strukturen dennoch recherchierbar zu machen, wird daher ein anderes Konzept benötigt, das FIZ Karlsruhe gemeinsam mit InfoChem mit der Implementierung von DWPIM als Datenbank in STN verwirklicht hat.

 

Zunächst mussten aber einige Herausforderungen bewältigt werden:

Wenn eine Markush-Suche durchgeführt wird, dann sollen im Suchergebnis alle Verbindungen enthalten sein, die für die Fragestellung relevant sind, auch und vor allem solche Verbindungen, die in beliebigen Markush-Varianten versteckt sind.

 

Die Lösung: Entwicklung einer geeigneten Markush-Suchmaschine, die diesen Herausforderungen gewachsen ist.


Die Anforderungen an das System

Besondere Anforderungen ergeben sich aus der grundlegenden Funktionalität von STN. Das Suchkonzept von STN sieht vor, möglichst mit einer gesuchten Struktur in allen Strukturdatenbanken zu recherchieren. Dieses Alleinstellungsmerkmal soll natürlich auch mit der neuen Funktionalität erhalten bleiben.

 

FIZ Karlsruhe hat daher das Indexierungskonzept von Derwent mit dem Suchkonzept von STN verbunden und integriert. Das neue System stellt nicht nur die Funktionalität der bisherigen DWPIM-Datenbank (bisher „Merged Markush Service“) bereit, sondern löst darüber hinaus Probleme des existierenden Systems und unterstützt zusätzlich neue Features.

 

Die Beurteilung der Relevanz von gefundenen Markush-Strukturen ist sehr zeitaufwändig und daher von großer Bedeutung für die Nutzer. Zur besseren Nutzerorientierung wird die Anzeige der Strukturen durch farbliche Hervorhebung der gesuchten Struktur und eine geeignete Zusammenführung der Kernstruktur mit den relevanten Varianten aufbereitet.

 

FIZ Karlsruhe hat zu diesem Zweck besonders anschauliche und effiziente Display-Typen entwickelt. Diese erlauben dem Nutzer ein schnelles und zugleich zuverlässiges Durchsuchen und Bewerten der Ergebnisse.


Ein wichtiger Meilenstein

Das aktuelle Release der DWPIM-Datenbank ist ein wichtiger Meilenstein zur Weiterentwicklung der chemischen Struktursuchen für Markush-Strukturen.

 

Damit ist das Projekt aber noch lange nicht abgeschlossen! In enger Zusammenarbeit mit unserem Partner InfoChem wird die Markush-Suchmaschine in Zukunft sukzessive weiterentwickelt. Hierfür evaluieren wir in engem Kontakt mit wichtigen Industriekunden regelmäßig die Kundenanforderungen, die wir dann in weiteren Releases umsetzen werden. Auf diese Weise unterstützen wir die Kunden bei den komplexen und anspruchsvollen Patentrecherchen im Bereich der Chemie. Dies ist ein wichtiger Beitrag zu „Advancing Science“.

 

Redaktion: HAU/BAB