Wie nützlich ist ChatGPT für die Apotheke? |
Chatbots werden Apothekerinnen und Apotheker in den kommenden Jahren in der Beratung nicht ersetzen können. Zu diesem Schluss kommen zwei Wissenschaftler von der Technischen Universität Braunschweig, die den Chatbot zu pharmazeutischen Fragestellungen testeten. / Foto: Adobe Stock/Timon
ChatGPT (Generative Pre-trained Transformer) und seine Konkurrenzprodukte wie Bing und Perplexity.ai sind Large Language Models. Für derartige Modelle wird Sprache gesammelt und klassifiziert. Dazu wird ein artifizielles neuronales Netzwerk (ANN), eine Verknüpfung von künstlichen Neuronen (Algorithmen), eingesetzt. Dieses Netzwerk ist in der Lage, auf Spracheingaben passende Antworten zu generieren. Trainiert wurde das ANN mit zu etwa 60 Prozent Chatverläufen aus dem Internet sowie mit Büchern und Wikipedia-Einträgen. Am besten beherrschen die Chatbots das Englische, da besonders viele Texte in dieser Sprache verfügbar sind. ChatGPT beherrscht auch andere Sprachen, etwa die Deutsche.
Den Umgang mit Sprache beherrscht ChatGPT bereits sehr gut. Kurze Maschinenantworten sind von menschlichen Texten nicht zu unterscheiden. Auch bei längeren Texten ist die eindeutige Zuordnung anhand des Sprachstils zu ChatGPT schwierig. Nun stellt sich die Frage, ob der Bot mehr kann, als rein gesammelte Sprache gut wiederzugeben. Und ist es möglich, dass zusätzliche Eigenschaften ungeplant bei der Anlage des ANN entstehen? Fachleute nennen dies Emergenz. Es scheint so: In einer Studie aus San Diego, USA, konnte ChatGPT medizinische Fragen von Patienten ausführlicher, besser und empathischer beantworten als Ärzte.
Ob sich dies bei Fragen zu pharmazeutischen Themen ähnlich verhält, haben wir am Institut für Medizinische und Pharmazeutische Chemie der Technischen Universität Braunschweig getestet (Die detaillierten Chatverläufe dazu sind hier zu finden).
Es ist erstaunlich, wie gut die Antworten von ChatGPT teilweise sind. Die Qualität beruht auf den vielen Nachschlagewerken, die in den Trainingstexten enthalten waren. Wenn für eine Aufgabenstellung Texte frei zugänglich sind und diese recherchiert, zusammengestellt und formuliert werden sollen, kann ChatGPT 4.0 seine Stärken ausspielen.
Wir haben uns zum Beispiel von dem Bot eine Reiseapotheke für einen Thailandurlaub zusammenstellen lassen:
Auch die Hinweise zu möglicherweise sinnvollen Reiseimpfungen und zur Mitnahme von verordneten Betäubungsmitteln nach Thailand waren gut, auch wenn wir von einer internationalen Apotheke noch konkretere und detaillierter Informationen erwarten würden.
Auch wenn heute bereits Rezepte digital eingelesen und die verschriebenen Arzneimittel automatisch bereitgestellt werden können – Chatbots werden Apotheker in den kommenden Jahren in der Beratung nicht ersetzen können. Denn ihre Antworten auf pharmazeutische Fragestellungen sind in vielen Punkten fehlerhaft oder ungeschickt. Um zu verstehen, was in der Zukunft in diesem Bereich zu erwarten ist, sollten die Stärken und Schwächen der generativen KI genauer betrachtet werden.
Kunden erwarten, dass das Apothekenteam eine konkrete Präparate-Empfehlung ausspricht. Das beherrscht ChatGPT noch nicht. / Foto: Getty Images/Westend61
Zunächst einmal wird der Bot ChatGPT als freundlich empfunden, da er fast immer den richtigen Ton trifft. Er gibt schnell Antworten. Er wird nicht müde und ist geduldig. Spannenderweise ist er aber nicht immer ehrlich: In den Trainingstexten scheinen sich so viele Unwahrheiten, Übertreibungen und Selbstdarstellungen zu finden, dass diese auf die maschinellen Antworten abfärben. Das ist ein Beispiel für eine sehr interessante Emergenz. Zusätzlich fällt in unseren Untersuchungen auf, dass die Antworten nicht sehr kreativ sind und dass der Bot nicht gut zu Entscheidungen fähig ist.
ChatGPT stellt gern verschiedene Handlungsoptionen vor und legt sich nicht fest. Dies ist zum Beispiel an dieser Antwort zur Akutbehandlung von Migräne zu erkennen (in diesem Fall ist die gesamte Aussage nicht ganz korrekt): »In der Regel werden für die Akutbehandlung von Migräne Schmerzmittel wie Ibuprofen, Paracetamol oder Aspirin empfohlen. Es gibt auch spezielle Migräne-Medikamente, die sogenannten Triptane, wie Sumatriptan, Rizatriptan oder Eletriptan, die gezielt auf die Behandlung von Migräne abzielen. Diese Medikamente können helfen, die Schmerzen, Übelkeit und Lichtempfindlichkeit während einer Migräneattacke zu lindern.« Patienten erwarten aber meist, dass der Apotheker für sie entscheidet und die richtige Behandlung empfiehlt.
Zudem ist es bei der Beratung von Patienten zum Beispiel zu Kopfschmerzen oder Magenschmerzen eine aktive Gesprächsführung wichtig, etwa mit Fragen nach der Vorgeschichte, bekannten Krankheiten, einer weiteren Arzneimitteleinnahme oder Mahlzeiten. Diese aktive Gesprächsführung beherrscht ChatGPT bisher nicht, wie Anfragen an ihn zu den genannten beiden Indikationen zeigten. Ihm fehlt wohl auch ein leistungsfähiges gedankliches Modell für seine Gesprächspartner.
Bisher ist auch die Fähigkeit zur Reflexion bei Chatbots nicht erkennbar. Sie können also nicht über eigene Gedanken, Handlungen oder Erfahrungen nachdenken und diese nicht bewerten; zumindest berichten die AI-Firmen nicht davon. Der Bot kann daher seine eigene Leistungsfähigkeit schwer einschätzen. Fragt man ihn, ob er sich bei einem bestimmten Sachverhalt sicher ist, gibt er keine gute Antwort.
Und ChatGPT kann zwar Texte effizient zusammenstellen, aber nicht sehr gut verstehen. Wenn ein Wort mehrere Bedeutungen haben kann, entscheidet er sich manchmal falsch, und auch noch eher leichte logische oder rechnerische Aufgaben (etwa wieviel CO2 bei der Einnahme einer bestimmten Menge von Natriumhydrogencarbonat entsteht) kann er nicht ohne weiteres lösen. Auch bei der Erstellung von Rezepturen ist der Bot überfordert.
Bei der Medikationsanalyse zeigte ChatGPT noch deutliche Schwächen. / Foto: ABDA
Zudem hatte ChatGPT Schwierigkeiten mit der Bearbeitung einer in der PZ veröffentlichten Medikationsanalyse. Er hatte nicht alle Aussagen verstanden oder es fehlten ihm Daten. Ihm entging eine Interaktion durch einen gemeinsamen Metabolismus über CYP2C19, ebenfalls eine erhöhte Blutungsneigung unter der Behandlung mit Escitalopram.
All diese Schwächen treffen die Leistungsfähigkeit von ChatGPT 4.0 nicht im Kern, denn für diese Aufgaben ist er nicht konstruiert. Diese Fähigkeiten hätten sich nur zufällig als Emergenz ergeben können. Es ist aber ein naheliegender Schritt, Weiterentwicklungen mit zusätzlichen Modulen auszurüsten, die zum Beispiel rechnen oder Entscheidungen vorbereiten können. An entsprechenden Lösungen wird bereits gearbeitet.
Eine bereits verfügbare ist der sogenannte KI-Agent Auto-GPT, dem man einen Plan wie die Erstellung einer Website zu einem bestimmten Thema vorgeben kann, den dieser dann in Teilaufgaben unterteilt und selbstständig ausführt.
Wie lange wird es nun dauern, bis die Bots so leistungsfähig und zuverlässig sind, dass sie bei einigen Aufgaben eine Verstärkung des Apothekenteams darstellen? KI hat inzwischen auch bei der Wirkstofffindung (DOI: 10.1002/minf.201501019), in der Pharmazeutischen Analytik (DOI: 10.3390/metabo10060243) und bei der Bestimmung von Proteinstrukturen (DOI: 10.1016/j.jmb.2021.167336) ihren festen Platz für Spezialanwendungen.
Wie die Entwicklung weitergehen könnte, lässt sich eventuell an Fortschritten in einem ganz anderen Bereich, den Schachcomputern, abschätzen: In den 1980er-Jahren erzielten diese ihre ersten Achtungserfolge und schlugen erstmals gute menschliche Spieler. Solche Achtungserfolge erzielt ChatGPT 4.0 heute im Sprachbereich.
Im Schach siegte acht Jahre nach den ersten Erfolgen ein Programm in einem Großmeisterturnier. Zehn Jahre später spielten sie so stark wie die menschliche Schachweltmeister. Mittlerweile ist es nahezu unmöglich, als Mensch gegen ein aktuelles Schachprogramm zu gewinnen. Es ist schon fast zehn Jahre nicht mehr davon berichtet worden.
Im Schach haben diese Entwicklungen einige Jahrzehnte benötigt. Es ist unklar, ob sich die generative KI wesentlich schneller entwickeln wird. Sie hat einiges Potenzial: Information in Datenbanken wird beispielsweise schneller und komfortabler verfügbar, auch die Leistungsfähigkeit der Systeme wird noch deutlich zunehmen.
Die Apothekerschaft sollte sich in größeren Abständen Gedanken machen, wo KI sinnvoll eingesetzt werden kann und wo sie von anderen eingesetzt werden wird. KI wird die Arbeitswelt in der Pharmazie vielleicht nicht revolutionieren, aber auf jeden Fall verändern. Der Berufsstand sollte diese Veränderungen aktiv mitgestalten.
Wer selbst austesten möchte, welche Antworten ChatGPT 4.0 auf Fragen gibt, kann sich hier anmelden. Die Registrierung dauert etwa fünf Minuten, es wird nach einer E-Mail-Adresse und einer Telefonnummer gefragt.
Professor Dr. Hermann Wätzig lehrt und forscht am Institut für Medizinische und Pharmazeutische Chemie an der Technischen Universität Braunschweig. Yannick Wilke ist Doktorand im Arbeitskreis Wätzig.