Machine learning für Jobklassifizierung

Ich hab ja schon einiges über Digitalisierung, machine learning (siehe auch machine learning in der Chemie) und artificial intelligence (AI) geschrieben.

Lange habe ich auch nach einer praktischen und sinnvollen Anwendung für machine learning gesucht. Inzwischen meine ich, die für mich gefunden zu haben.

Für meine Joblandkarte bekomme ich von StepStone Jobtitel, Beschreibung und Koordinaten geliefert. Allerdings sind dort auch für Chemiker weniger interessante Jobs z.B. für Biologen oder Ingenieure enthalten. Daher bewerte ich momentan noch von Hand die Relevanz, um diese rauszufiltern.

Das könnte doch auch ein Programm machen

Gedacht, getan. Schnell ein Jupyter-Notebook geöffnet, ein Beispiel auf realpython gesucht, und los geschrieben.

Die erste Herausforderung ist, die vorliegenden Daten in eine vernünftige und auswertbare Form zu bringen. Ich habe die Beschreibung vektorisiert und die Vektoren dann in Trainings- und Testdaten aufgeteilt. Da ich nicht so viele Daten habe, musste ich auf separate Validierungsdaten verzichten.

Mit diesen Trainingsdaten habe ich dann ein TensorFlow-Modell mit Keras erstellt. Und dieser erste Versuch lieferte eine Trefferwahrscheinlichkeit von ca. 82%. Ganz ok für den ersten Versuch. Allerdings wäre eine Logistic Regression in diesem Fall genauso gut.

Ich werde das Modell noch verfeinern und hoffentlich irgendwann produktiv einsetzen können.

Machine learning – Der Einstieg ist einfach

Es ist sehr einfach, mit Python, Jupyter, Keras und TensorFlow schnell ein mehr oder weniger (eher weniger) gutes neuronales Netz aufzusetzen und damit rumzuprobieren. Wer mehr wissen will, sollte den Artikel auf Realpython gut lesen.

Jobs für Chemiker als Datenanalysten

In meiner Serie „Karrieremöglichkeiten für Chemiker“ beschreibe ich unterschiedliche Stellenprofile, in denen Chemiker arbeiten können.

Heute möchte ich hier über Chemiker als Datenanalysten schreiben. Anlass ist eine Stelle bei der BASF-Tochter trinamiX, die einen Data Scientist für Chemometrie sucht.

Wo arbeiten Chemiker als Datenanalysten?

Damit wäre auch schon ein Teil der ersten Frage beantwortet. Datenanalysten können in großen Chemiefirmen arbeiten, z.B. bei der Entwicklung von Sensoren und Analysesystemen. Aber auch in der Produktion wird die Analyse von Daten immer wichtiger.

Ein Stichwort hier ist die Digitalisierung, über die ich schon einiges geschrieben habe. Für Machine Learning werden eine Menge Trainingsdaten benötigt, die schon analysiert wurden, sei es für predictive maintenance oder für eine schnellere Entwicklung.

Ich stelle mir vor, dass Datenanalysten auch im Pharmabereich gesucht werden, um beispielsweise die Daten von klinischen Studien auszuwerten. Primär ist das natürlich die Aufgabe von Medizinern und Medizininformatikern, aber für erfahrene Pharmachemiker gibt es dort auch eine Daseinsberechtigung.

Ein anderer Weg für Naturwissenschaftler wäre, bei einer Bank oder Versicherung als Analysten anzufangen. Darum soll es aber in diesem Beitrag nicht gehen.

Wie ist die typische Stellenbeschreibung?

Eine typische Stellenbeschreibung zu ermitteln, ist schwierig. Das liegt auch an der immer wichtigeren Rolle, die Daten in der Industrie spielen werden.

Ich denke aber, dass neben einem soliden chemischen Verständnis Kenntnisse der Statistik, der Datenanalyse und -modellierung und Erfahrungen im Machine Learning wichtig sind bzw. werden.

Dazu ist es meiner Ansicht nach nötig, sich mit Datenbanken (SQL, …) und Programmierung (Python, R…) auszukennen.

Zusätzlich muss das Spezialgebiet, dessen Daten analysiert werden sollen, eine Kernkompetenz sein.

Mehr über Datenanalyse könnt ihr auf WILA lesen.

Wie finde ich Stellen?

Meine Prognose ist, dass man sich als Berufseinsteiger schwer tun wird, eine solche Stelle zu besetzen. Gerade die Kompetenz im zu analysierenden Gebiet muss man sich im Beruf erwerben. Ansonsten gibt es inzwischen auf den einschlägigen Portalen Stellenausschreibungen, beispielsweise auch auf meiner StepStone-Seite.

Falls ihr eher geographisch Jobs suchen wollt, schaut auf meine Job-Karte.

Machine Learning in der Chemie

Momentan beschäftige ich mich (hauptsächlich aus Neugierde, aber auch weil die Digitalisierung in der Chemie kommt, oder?) mit Machine Learning, genauer Deep Learning und Big Data. Und ich frage mich, woher ein nicht-digitales Unternehmen die ganzen Daten nehmen soll, die für diese Art des Lernens und des Erkenntnisgewinns wohl entscheidend sind. Und dazu noch eines, was in der EU sitzt…

Vielleicht fehlt mir hier die Fantasie, also schauen wir mal. Selbstverständlich gibt es im Internet Artikel en masse zu diesem Thema, beispielsweise hier oder hier. Erstaunlich, das ist ja zweimal der selbe Artikel. Schreiben hier schon Algorithmen voneinander ab?

Wofür Machine Learning?

Oft gelesene Ansatzpunkte für Machine Learning in produzierenden Unternehmen ist die gezielte Wartung von Maschinen, die aufgrund von Sensordaten als ausfallgefährdet identifiziert werden. Ich spare mir hier Verlinkungen, es gibt tausende Links zu Werbung von Software dafür. Das wäre natürlich was für die Chemieindustrie.

Ein anderes Szenario ist die Zuordnung von Produkten zu Kunden („Käufer von A kauften auch B…“ oder „Kunde X braucht wahrscheinlich C“). Hier ist es natürlich von Vorteil, wenn man viele Daten zu Transaktionen hat, die man verwerten kann. Da sind Plattformen wie Amazon (oder… oder wer?) klar im Vorteil.

Produktentwicklung

Fallen Euch auch Szenarien für die Produktentwicklung ein? Oft bekommt man ja keine Daten vom Kunden zurück. Sinnig ist es dann, ein vernetztes Produkt anzubieten, das mir viele Daten vom Kunden zurückmeldet. Beispiele wären eine neue Generation Autos, die permanent mit ihren Herstellern sprechen, dass diese laufend Erkenntnisse in ihre Entwicklungsprozesse speisen können.

Aber was macht man mit „dummen“ Produkten, wie zum Beispiel Speiseöl oder Frostschutzmittel?

Habt ihr Ideen? Schreibt gerne in den Kommentaren.

Digitalisierung in der Chemie

In den letzten Tagen konnte man in den Nachrichten lesen, dass „Digitalisierung und vernetzte Produktion“ jetzt Teil der Ausbildung von Chemikanten wird.

Abgesehen von der mir nicht bekannten konkreten Ausgestaltung finde ich es gut, dass sich die Tarifpartner Gedanken um die fachliche Qualifikation der neuen Auszubildenden macht. Sie könnten ja einfach davon ausgehen, dass die sogenannten „digital natives“, die routiniert mit Instagram, SnapChat und Facebook umgehen können, keine weitere Be-Lehrung in Richtung Digitalisierung braucht.

Es ist ja auch das Gegenteil der Fall, vermute ich. Diese Generation sind zum großen Teil digitale Konsumenten oder im besseren Fall Produzenten, die nicht wissen wollen, wie die Technik hinter den sozialen Medien funktioniert.

Ich halte es absolut nicht für nötig, dass jeder programmieren kann, aber zumindest die Prinzipien und die Funktionsweise von grundlegenden Technologien rund ums Internet (und damit fast synonym zu xyz 3.0 oder 4.0) müssen erlernt und gelehrt werden.

Über die Herausforderungen der Digitalisierung liest man in letzter Zeit auch sehr viel, darauf möchte ich gar nicht eingehen. Aber jemand, der die Hintergründe versteht, kann eher einschätzen, was technologisch möglich und sinnvoll ist und muss nicht jedem Trend (Augmented Reality, Künstliche Intelligenz…) hinterherlaufen.

Was machen hier eigentlich die Universitäten? Auf gar keinen Fall darf man nämlich davon ausgehen, dass jemand mehr Ahnung von IT-Hinter- und Abgründen hat, nur weil eine Universität besucht hat.