Angewandte Computerlinguistik der Goethe-Universität kooperiert mit Springer Nature.
Das erste maschinengenerierte Buch, das bei Springer Nature erscheint, entstand mithilfe eines Algorithmus, der von Wissenschaftlern der Goethe-Universität entwickelt wurde. Obwohl schon lange zu diesem Thema geforscht wird, betreten der Verlag und die Informatiker damit Neuland, denn es ist zuvor noch kein maschinengeneriertes Buch von einem Wissenschaftsverlag veröffentlicht worden.
Das Buch bietet einen Überblick über die neuesten Forschungspublikationen zum Thema Lithium-Ionen-Batterien – eine strukturierte, automatisch generierte Zusammenfassung einer großen Anzahl aktueller Forschungsartikel. Forscher erhalten hierdurch die Möglichkeit, das schnell wachsende Informationsaufkommen auf diesem Gebiet effizient zu überschauen. Das Buch ist als kostenloser Download verfügbar.
Der unter Leitung von Juniorprofessor Dr. Christian Chiarcos an der Angewandten Computerlinguistik an der Goethe-Universität entwickelte Beta Writer basiert auf Verfahren, die Textinhalte mithilfe von Computern analysieren, so dass sie relevante Publikationen automatisch auswählen und verarbeiten, die zuvor auf der Plattform SpringerLink veröffentlicht wurden. Diese wissenschaftlich begutachteten Veröffentlichungen von Springer Nature werden von dem Algorithmus einem ähnlichkeitsbasierten Clustering unterzogen, um die Quelldokumente in zusammenhängende Kapitel und Abschnitte zu gliedern.
In diese Kapitelstruktur werden prägnante Zusammenfassungen der publizierten Artikel eingefügt und miteinander verflochten. Die extrahierten Textpassagen sind mit Hyperlinks versehen, so dass der Leser eindeutige Verweise auf die Quelldokumente erhält. Automatisch erstellte Inhaltsverzeichnisse und Referenzen erleichtern die Orientierung innerhalb des Buchprototypen.
„Mit dieser Publikation wollen wir zeigen, zu welchem Grad die Herausforderungen der maschinengenerierten Publikation inzwischen gelöst werden können, wenn Fachleute aus wissenschaftlichen Verlagen mit Computerlinguisten zusammenarbeiten“, erklärt Juniorprofessor Christian Chiarcos. „Wir haben bei diesem Projekt auch besser verstanden, welche Erwartungen es auf Seiten der Autoren, Herausgeber, Verlage und Käufer gibt. Und zwar sowohl in Bezug auf die wissenschaftlichen als auch die wirtschaftlichen Anforderungen.“
Henning Schoenenberger, Director Product Data & Metadata Management bei Springer Nature, fügt hinzu: „Während Forschungsartikel und -bücher, die von Wissenschaftlern und Autoren geschrieben werden, auch weiterhin eine entscheidende Rolle im wissenschaftlichen Publizieren spielen werden, erwarten wir zukünftig eine Vielzahl an verschiedenen Inhaltstypen: von vollständig von Menschen erstellten Inhalten über verschiedene Blended-Man-Machine-Textgenerierungen hin zu vollständig maschinengenerierten Texten. Unser Prototyp ist ein erster wichtiger Meilenstein auf diesem Weg. Wir hoffen, dass wir als Verlag dazu beitragen, eine öffentliche Debatte über die Chancen, Auswirkungen, Herausforderungen und potenziellen Risiken von maschinengenerierten Inhalten im wissenschaftlichen Umfeld anzustoßen.”
Link zur Publikation: https://link.springer.com/book/10.1007/978-3-030-16800-1
Informationen: Juniorprofessor Dr. Christian Chiarcos, Angewandte Computerlinguistik, Fachbereich Mathematik und Informatik, Campus Bockenheim, Tel. (069) 798 22463:, chiarcos@informatik.uni-frankfurt.de, http://acoli.cs.uni-frankfurt.de/
Quelle: Pressemitteilung vom 4. April 2019