Diese Seite wurde mit fastpages aufgebaut und als Vorlage benutzt.
Projekt Frunch Infinity
Zusammenfassung:
Die Idee unserer Projektgruppe “Frunch Infinity” ist es, eine Auto Machine Learning Schnittstelle zu erstellen, auf der einerseits ein Datensatz auswählbar ist und im Anschluss durch Klick auf einen Action-Button der Output mehrerer statistischer Modelle erstellt und verglichen werden kann. Inhaltlich betrachtet wird ein automatisierter ML-Prozess entwickelt, welcher zunächst einen Rohdatensatz in einer Preprocessing-Pipeline bereinigt und im Anschluß mithilfe des Python Package PyCaret trainiert. Durch PyCaret bietet sich die Möglichkeit den Output mehrerer Modelle und dessen Metriken miteinander zu vergleichen. Der entsprechende Output wird auf Streamlit publiziert. Darüber hinaus besteht innerhalb des Streamlit-Dashboards die Möglichkeit, den Datensatz erneut zu trainieren. Da das Projekt vorerst einen MVP-Ansatz verfolgt, liegt der Fokus auf dem Turbofan-Datensatz, sowie dem Training und der Auswertung von Regressions-Modellen.
Die größte Herausforderung für mich war es, allgemein ein Softwareentwicklungs-Projekt aufzusetzen. Da ich in der Vergangenheit kaum Berührungspunkte mit Softwareentwicklung bzw. CI/CD, Projekt-Templates (Cookiecutter etc.), Testing und Techniken wie Refactoring oder Design Patterns hatte, war sämtlicher Input über Tools und Techniken neu für mich. Ich habe das Gefühl viele erste Informationen über die Vorgehensweise in der Durchführung eines Softwareentwicklungsprojekt gesammelt zu haben. Um Tools wie beispielsweise Docker-Container umfänglich zu verstehen, fehlte allerdings die Zeit.