Beantwortung natürlicher Sprachfragen über Wissensgraphen mit menschenähnlichem, modularem Ansatz zur Frageninterpretation und Antworterzeugung
Aleksandr Perevalov und Prof. Dr. Andreas Both von Forschungsgruppe Web & Software Engineering (WSE) der Fachgruppe Informatik der Fakultät Informatik und Medien der HTWK Leipzig haben Anfang Juni bei der TEXT2SPARQL-Challenge im Rahmen der renommierten Extended Semantic Web Conference (ESWC 2025) in Slowenien einen bedeutenden Erfolg erzielt.
Mit ihrem System mKGQAgent bzw. der zugehörigen Veröffentlichung „Text-to-SPARQL Goes Beyond English: Multilingual Question Answering Over Knowledge Graphs through Human-Inspired Reasoning“ erreichte das Team den ersten Platz in den Kategorien „Overall Performance“ und „DBpedia – Spanish Language“.
Die TEXT2SPARQL-Challenge widmet sich dem Forschungsfeld des Knowledge Graph Question Answering (KGQA). Dabei werden natürlichsprachige Fragen nach Fakten von Nutzerinnen und Nutzern automatisch in formale SPARQL-Anfragen umgewandelt, mit denen strukturierte Datenbanken, sogenannte Wissensgraphen, abgefragt werden können. Die besondere Herausforderung besteht darin, dass – im Gegensatz zu klassischen Suchmaschinen – nicht eine Liste möglicher Ergebnisse, sondern exakt eine korrekte Antwort geliefert werden muss.
Im Rahmen des Wettbewerbs traten zahlreiche internationale Teams gegeneinander an. Bewertet wurden nicht das theoretische Konzept, sondern die konkrete, lauffähige Implementierung des Ansatzes. Alle Wettbewerbsteilnehmer wurden automatisiert anhand eines bis zu diesem Zeitpunkt geheim gehaltenen Benchmarks geprüft, sodass alle Systeme unter realistischen und vergleichbaren Bedingungen getestet wurden. Die Ergebnisse wurden anschließend verglichen, wobei sich der Ansatz der HTWK Leipzig übergreifend („Overall Performance“) und insbesondere mit spanischen Fragen auf der DBpedia-Wissensbasis („DBpedia – Spanish Language“) als führend erwies.
Im Zentrum des erfolgreichen Verfahrens steht “mKGQAgent”, ein neuartiger KI-Agentenansatz für die Beantwortung natürlicher Sprachfragen über Wissensgraphen. Dieser verfolgt einen menschenähnlichen, modularen Ansatz zur Frageninterpretation und Antworterzeugung: Anstatt lediglich auf rein neuronale oder regelbasierte Methoden zu setzen, zerlegt mKGQAgent die komplexe Aufgabe der SPARQL-Generierung in nachvollziehbare, interpretierbare Teilschritte – darunter Planung, Entitätenverknüpfung und Anfrageverfeinerung. Dabei nutzt das System ein koordiniertes Zusammenspiel von LLM-Komponenten (Large Language Models) mit einem erfahrungsbasierten Lernpool, der eine effiziente In-Context-Anpassung erlaubt – ohne dass das zugrunde liegende Modell wiederkehrend neu trainiert werden muss.
Besonders hervorzuheben ist die starke Leistung im mehrsprachigen Bereich des Wettbewerbs. Während viele Ansätze im Bereich der KI-Sprachverarbeitung vorrangig auf die englische Sprache fokussiert sind, verfolgt die WSE-Forschungsgruppe seit Jahren bewusst einen sprachagnostischen Ansatz, der auch für weniger verbreitete Sprachen geeignete Lösungen bietet. Diese strategische Ausrichtung wurde nun durch den internationalen Wettbewerbserfolg eindrucksvoll bestätigt. „Die Auszeichnung ist nicht nur eine Bestätigung unserer langjährigen Forschung, sondern auch ein Beweis dafür, dass zukunftsfähige KI-Systeme flexibel, transparent, sprachlich inklusiv und dabei auch preisgünstig sein können“, so Prof. Dr. Andreas Both.
Aleksandr Perevalov, der als Doktorand in der Forschungsgruppe tätig ist, wird seine Promotion zum Thema „Multilingual Question Answering over Knowledge Graphs“ im Sommer 2025 abschließen. Der Erfolg des mKGQAgent-Ansatzes ist maßgeblich getragen von diesen Ergebnissen und ist ein Beispiel für exzellente Nachwuchsforschung an der HTWK Leipzig sowie eine Bestätigung seiner persönlichen Leistungen. Die Arbeit ist eingebettet in die WSE-Forschungsgruppe der HTWK Leipzig, die sich auf die Schwerpunkte moderne Softwareentwicklungsmethoden, Webtechnologien, Datenverarbeitung und KI-Methoden konzentriert. Ziel ist es, innovative und praxisrelevante Lösungen an der Schnittstelle von Softwaretechnik und intelligenter Informationsverarbeitung zu entwickeln.
Die Ergebnisse der Forschungsgruppe liefern wichtige Impulse für die Weiterentwicklung von multilingualen Frage-Antwort-Systemen und zeigen das Potenzial menschenähnlicher Schlussfolgerungsprozesse in der semantischen Informationsverarbeitung auf.
Referenzen: Aleksandr Perevalov, Andreas Both (2025). mKGQAgent: Multilingual Human-inspired Question Answering over Knowledge Graphs. First International TEXT2SPARQL Challenge, co-located with the 4th International Workshop on Knowledge Graph Generation from text (TEXT2KG) at Extended Semantic Web Conference (ESWC) 2025.