Grundlagenorientierte, interdisziplinäre Projekte, die durch eine Zusammenarbeit vor allem der Fachgebiete Physik, Mathematik und Informatik insbesondere im Bereich numerischer und statistischer Modelle zustande kommen. Hiermit sind explizit Projekte gemeint, die sich auch mit neuen Herangehensweisen beschäftigen, ohne auf bisherige Methoden oder Tools zurückzugreifen.
Förderbekanntmachung zum Thema Künstliche Intelligenz
Im Bereich der KI wurden in den letzten Jahren enorme Fortschritte erzielt. Die aktuellen Fortschritte der KI, insbesondere im Bereich des Maschinellen Lernens (ML), basieren einerseits auf der gesteigerten Leistungsfähigkeit von Hardware zur Verarbeitung großer Datenbestände und andererseits auf einer stetig wachsenden Datenbasis.
Kleine und mittelgroße Unternehmen in Deutschland stehen häufig vor dem Problem, dass ihre Datenbestände für die Umsetzung von innovativen KI-Dienstleistungen und Produkten nicht hinreichend groß sind, die vorliegenden Daten nicht den notwendigen Anforderungen entsprechen oder die erzeugten datengetriebenen KI-Modelle nicht ausreichend getestet werden können.
Das BMBF beabsichtigt daher, im Rahmen dieser Richtlinie die anwendungsorientierte Erforschung und Entwicklung (FuE) von Lösungen zur Erzeugung synthetischer Daten für die KI zu fördern. Durch die Maßnahme soll die Spitzenposition Deutschlands im Bereich KI gesichert und weiter ausgebaut werden. Sie ist Teil der Umsetzung der KI-Strategie der Bundesregierung und der Hightech Strategie 2025.
Auszug aus der Förderbekanntmachung des BMBF:
Daten spielen eine herausragende Rolle im Bereich der Künstlichen Intelligenz. Die Auswahl repräsentativer Daten ist entscheidend für den Lernprozess sowohl für die Güte der datengetriebenen KI als auch für den Lernerfolg. Sind die Daten weder in ausreichender Menge vorhanden noch repräsentativ genug, so kann ein mit diesen Daten gelerntes Modell die Informationen nicht hinreichend gut klassifizieren. Hier können (Simulations-)Modelle weiterhelfen, die die fehlenden Daten liefern.
Um (Simulations-)Modelle zur Erzeugung von realistischen Daten nutzen zu können, müssen diese so weiterentwickelt werden, dass die erzeugten Daten auch selten auftretende Ereignisse und fehlerbehaftete Eingabewerte in hinreichender Zahl enthalten. Weiterhin muss garantiert werden, dass die Daten keinen wie auch gearteten Bias enthalten und zur Erzeugung bzw. Validierung von diskriminierungsfreien möglichst generischen KI-Modellen genutzt werden können. Die Art der erzeugten Daten sollte dabei möglichst die gesamte Bandbreite von Bildern über uni- und multimodale Sensordaten bis hin zu Zeitreihen umfassen.
Grundsätzlich sind vier Arten von Projekten möglich, die auch kombiniert werden können:
Methodenentwicklungsprojekte, die sich mit der essentiellen Weiterentwicklung schon bestehender Ideen beschäftigen. Hierbei sollen Projekte im Fokus stehen, die Methoden entscheidend verbessern oder durch neue Verfahren erweitern.
Werkzeugentwicklungsprojekte, die sich mit der Neuentwicklung von Werkzeugen für die Datenerzeugung beschäftigen. Damit sind allerdings keine reinen statistischen Werkzeuge gemeint, sondern intelligente Tools mit neuen Kenngrößen, die Daten in ausreichender Güte und Repräsentativität erzeugen.
Validierungswerkzeugprojekte, die sich mit der Neuentwicklung von Methoden und Werkzeugen für die Validierung der datenbasierten KI-Modelle (Benchmarking) beschäftigen. Die Ergebnisse der Validierungswerkzeugprojekte sollen nach Möglichkeit einfach auf verschiedene Domänen übertragbar sein.
In der Fördermaßnahme wird die Durchführung von FuE-Vorhaben gefördert, die Bezüge zu einem oder mehreren der folgenden Themen aufweisen:
Datensynthetisierung: Techniken zur Erzeugung synthetischer Daten aus Simulations- oder Repräsentationsmodellen. Hierbei geht es um grundlegende Methoden der Mathematik und Physik zur Entwicklung von Modellen einschließlich der Software-Entwicklung auf entsprechenden Simulationssystemen. Gegenstand der Förderung sind grundlegende Algorithmen. Methoden, die High Performance Computing (HPC) benötigen, sind nicht Gegenstand der Förderung.
Statistische Methoden: Innovative Methoden und robuste, alltagstaugliche Techniken und Werkzeuge zur Analyse der erzeugten Daten. Diese müssen ein Mindestmaß an Qualität und Heterogenität aufweisen. Idealerweise sollten diese Kriterien in die Simulationsmodelle integriert werden. Aufgrund der Komplexität solcher Modelle müssen entsprechende Methoden noch entwickelt werden.
Kenngrößen zur Messung von Eignung, Güte oder Bias-Freiheit der Daten: Innovative Methoden zur Klassifikation von Daten. Adressierbar sind hier Ansätze, die neue Kenngrößen einführen, um die Eignung, den Bias oder die Güte von Daten zu messen. Hierbei sind unter Umständen neue Techniken notwendig, die über die üblichen statistischen Kenngrößen hinausgehen.
Sichere Anonymisierung bestehender Datensätze: Die Anonymisierung von Datensätzen soll verhindern, dass natürliche Personen, deren Daten in den Datensätzen enthalten sind, identifiziert werden können. Im Rahmen der Bekanntmachung sollen einfach anzuwendende Methoden und Werkzeuge entwickelt werden, die eine sichere Anonymisierung bestehender Datensätze garantieren, ohne die für die Modellbildung relevanten Eigenschaften im Datensatz zu beeinflussen. Weiterhin sollen diese Werkzeuge/Methoden das Maß der Sicherheit beschreibbar bzw. messbar machen können.