Computergestützte Chemie: die Entdeckung neuer Moleküle
Es gibt zu viele theoretisch mögliche chemische Verbindungen, als dass sie systematisch vorausberechnet werden könnten. Um trotzdem sinnvolle Vorhersagen treffen zu können, möchte dieses Projekt maschinelles Lernen mit modernen Näherungsverfahren der Quantenchemie kombinieren.
Porträt / Projektbeschrieb (abgeschlossenes Forschungsprojekt)
Maschinelles Lernen ist ein mathematisches Verfahren, das Rechnern ermöglicht, selbständig Wissen aus gegebenen Datensätzen zu erlernen. Diese Technik wird bereits mit Erfolg zur Vorhersage der Eigenschaften von chemischen Verbindungen verwendet. Solche Vorhersagen sind aufgrund der extrem hohen Anzahl chemischer Verbindungen allerdings nicht sonderlich genau. Dies rührt von der Tatsache, dass die zur Verfügung gestellten Datensätze entweder genügend genau, aber zu klein sind – oder genügend gross, aber zu ungenau. In diesem Projekt versuchen wir deshalb, aus einer geschickten Kombination von wenigen hochgenauen Daten und vielen weniger genauen Daten verbesserte Vorhersagemodelle zu entwickeln.
Hintergrund
Die Synthese und das Testen von neuen Werkstoffen in der chemischen Industrie oder von neuen Medikamenten in der Pharmazie kosten viel Zeit und Geld. Dieser Aufwand liesse sich beträchtlich reduzieren, wenn es gelänge, die Komplexität chemischer Verbindungen zu bezwingen. Das Projekt möchte mit verbesserten mathematischen Verfahren die zielgenaue Entwicklung von chemischen Verbindungen mit gewünschten Eigenschaften ermöglichen.
Ziele
Ziel dieses Projekts ist die Entwicklung eines leistungsfähigen Verfahrens zur Vorhersage der Eigenschaften von chemischen Verbindungen. Leistungsfähig bedeutet in diesem Kontext, dass für eine beliebige chemische Verbindung eine hochgenaue Vorhersage der Eigenschaften in extrem kurzer Rechenzeit verfügbar ist.
Bedeutung / Anwendung
Dieses Projekt stellt experimentellen Chemikern ein neues Werkzeug bereit, das sie bei Identifizierung, Design, Synthese und Charakterisierung neuartiger und interessanter Verbindungen mit augenblicklichen Vorhersagen anleiten kann. Zusätzlich impliziert der Erfolg solcher Modelle ein verbessertes quantitatives Verständnis für die Beziehung zwischen chemischen Strukturen und ihren Eigenschaften.
Ergebnisse
Resultate wurden innerhalb dieses Projekts in drei Teilen erbracht.
Im ersten Teil wurden Trainings-/Testdaten erarbeitet. Alle Datensätze wurden veröffentlicht und für wissenschaftliche Zwecke zur Verfügung gestellt.
Der zweite Teil befasste sich mit Quanten-Maschinenlernmodellen, die verschiedene Genauigkeiten von Quanten-Referenzdaten mit unterschiedlichen Rechenkosten / Genauigkeit nutzen. Die sogenannte Lernkurve konnte stark verbessert werden, was bedeutet, dass das erzielte Quanten-Maschinenlernmodell jetzt viel leistungsfähiger ist.
Der dritte Teil ist die mathematische Basis und die Entwicklung numerischer Methoden für Big-Data-Probleme.
Alle Erkenntnisse helfen, maschinelle Lernmodelle weiter zu verbessern.
Originaltitel
Big Data for Computational Chemistry: Unified machine learning and sparse grid combination technique for quantum based molecular design