No-Code, groß angelegte Bereitstellungen und multimodale Ansätze werden NLP im Jahr 2022 definieren - ReadWrite

NLP auf einen Blick

Wenn die meisten Leute an Natural Language Processing (NLP) denken, Sprachassistenten wie Alexa und Siri fallen mir ein. Während die Interaktion zwischen Mensch und Maschine einen langen Weg zurückgelegt hat, kratzt sie nur an der Oberfläche dessen, was die Technologie leisten kann. Tatsächlich beinhaltet der wirkungsvollste Einsatz von NLP überhaupt keine Sprache.

Aber beginnen wir mit der Definition von NLP. Die Technologie ist eine Untergruppe von künstlicher Intelligenz (KI) und maschinellem Lernen (ML), die sich darauf konzentriert, Computern zu ermöglichen, menschliche Sprache zu verarbeiten und zu verstehen. Obwohl Sprache dazu gehört, liegt der wirkungsvollste Fortschritt im NLP in seiner Fähigkeit, geschriebenen Text zu analysieren.

Daher findet NLP weitgehend hinter den Kulissen statt. Aber die Leute interagieren mehr damit, als sie wissen. Von Krankenhäusern über Finanzdienstleistungen bis hin zu Anwaltskanzleien, NLP unterstützt einen Großteil der Lese-, Schreib- und Datenanalyse, die zur Verwaltung dieser Dienste verwendet werden. Auch als junge Technologie hat sie sich in den letzten Jahren im Unternehmen durchgesetzt.

Was kommt als nächstes für NLP

Alle Anzeichen deuten darauf hin, dass sich dieses Wachstum fortsetzt. Selbst inmitten der globalen Pandemie, Die NLP-Ausgaben stiegen, während die allgemeinen IT-Ausgaben einen Einbruch erlitten haben. Die Investitionen in NLP haben diesen Weg in diesem Jahr fortgesetzt. nach a aktuelle Branchenumfrage, gaben 93% der Tech Leaders an, dass ihr NLP-Budget im Vergleich zu 2020 um mindestens 10-30% gestiegen ist.

2021 war ein vielversprechendes Jahr für NLP. Anwendungsfälle haben Benutzern bei allem geholfen, von der Identifizierung von gefälschten Nachrichten und toxischen Inhalten im Internet bis hin zur Beschleunigung klinischer Studien durch eine bessere Kandidatenauswahl. Auch über das Gesundheitswesen und die Medien hinaus bewährt sich NLP branchenübergreifend.

Es gibt jedoch mehrere Faktoren, die dieses Wachstum im Jahr 2022 auf die nächste Stufe heben können. No-Code-Software, Fortschritte bei groß angelegten Bereitstellungen und multimodale Ansätze für NLP werden im kommenden Jahr erheblich zu seinem Wachstum beitragen. Hier ist der Grund:

Low-Code ist toll

Low-Code erfordert wenig bis gar keine Erfahrung in der Codierung, um eine Anwendung zu erstellen. Es überrascht nicht, dass Low-Code-Lösungen letztes Jahr einen Moment hatten. Die Vereinfachung von NLP ist ein todsicherer Weg, um kontinuierliches Wachstum in diesem Bereich zu gewährleisten. Es ermöglicht Praktikern aller Erfahrungsstufen, die Technologie zu nutzen. Zusammenfassend lässt sich sagen, dass die Ausführung vieler der komplexesten Deep-Learning-Modelle jetzt auf eine einzige Zeile Python-Code reduziert werden kann.

Für NLP-Neulinge senkt dies die Eintrittsbarriere. Eine formale Ausbildung und praktische Erfahrung mit grundlegendem NLP, Deep Learning und Transfer-Learning-Bibliotheken waren früher eine Voraussetzung. Jetzt kann jeder mit nur einem grundlegenden Verständnis der Technologie beginnen.

Das ist nicht nur für Neueinsteiger wertvoll. Für Data Scientists ermöglicht die Vereinfachung einen Automatisierungsgrad, der es ihnen ermöglicht, sich auf wichtigere Aufgaben zu konzentrieren. Dies wird immer wichtiger, da die Der Mangel an KI-Talenten bleibt bestehen. Low-Code-Lösungen haben überall Vorteile, und glücklicherweise sehen wir jeden Tag mehr davon.

No-Code-KI wird Realität

2022 bauen wir auf dem Low-Code-Trend mit No-Code-Software auf. Dadurch werden KI und ML für jeden zugänglicher. Indem Sie mehr Macht in die Hände von Domänenexperten legen, machen Sie einen Datenwissenschaftler überflüssig und demokratisieren NLP noch weiter. Wir sehen bereits, dass sich dies abspielt.

Ziehen Sie zum Beispiel in Betracht, eine Website zu erstellen. Was früher Programmierkompetenz erforderte, kann heute weitgehend von einem Grafikdesigner übernommen werden. Auf diese Weise sickert No-Code zu Benutzern außerhalb des Programmiertitels. Es wird auch dazu beitragen, NLP für bestimmte geschäftliche Anwendungsfälle zu verfeinern. Wenn Sie KI-Modelle für das Gesundheitswesen erstellen, um COVID-19 in einem Lungenröntgen zu erkennen, möchten Sie schließlich, dass ein Arzt mehr abwägt als ein Datenwissenschaftler.

Die Bedeutungsverschiebung vom Datenwissenschaftler zum Domänenexperten wird schrittweise erfolgen, aber wir werden im kommenden Jahr viel einfacher anwendbare No-Code-Optionen sehen, um dies zu erleichtern. Dies ähnelt dem Unterschied zwischen dem Bezahlen von Programmierern für das Schreiben von Code und dem Verwenden von Excel. No-Code wurde für eine andere Gruppe von nicht-technischen Benutzern erstellt. Schließlich gibt es eine Klasse von Werkzeugen, die es ihnen ermöglichen, sich mit NLP vertraut zu machen.

Feinabstimmung von Modellen, um sie maßstabsgetreu einzusetzen

Im oben genannte Umfrage, nannten Technologieführer die Genauigkeit als den wichtigsten Faktor bei der Erwägung einer NLP-Lösung. Allerdings war der Schwierigkeitsgrad beim Tuning von Modellen eine der größten Herausforderungen, die von Technologieführern genannt wurden. Leider ist die kontinuierliche Abstimmung von Modellen für genaue Ergebnisse entscheidend. Ebenso wichtig ist, dass sie im Laufe der Zeit nicht abgebaut werden.

Das Gesundheitswesen ist eine Branche, in der eine kontinuierliche Überwachung und Optimierung besonders wichtig ist. Die Technologie geht davon aus, dass die Reparatur einer Person wie die Reparatur eines Autos ist. Wenn etwas kaputt ist, können Sie einfach eine wissenschaftliche Arbeit oder ein medizinisches Journal scannen und eine Lösung anwenden, um das Problem zu beheben. Aber der Mensch ist nicht so einfach. Es spielen viele Faktoren eine Rolle. Anamnese, soziale Determinanten der Gesundheit, wie Ihr Arzt Ihre Ergebnisse im Vergleich zu anderen interpretiert, sind nur einige davon.

Indem wir Fachexperten, in diesem Fall Mediziner, ermöglichen, Modelle anzupassen, ermöglichen wir ihnen, Modelle richtig auf bestimmte Situationen abzustimmen. Sehr oft müssen Modelle in größerem Umfang separat gestimmt werden. Dies liegt daran, dass Modelle in verschiedenen Produktionsumgebungen unterschiedlich funktionieren. Auch wenn sich beide in einem klinischen Umfeld befinden.

In den letzten Nachrichten, ergab eine retrospektive Studie in JAMA Internal Medicine, dass ein Modell, das entwickelt wurde, um eine Sepsis bei Patienten vorherzusagen, zwei Drittel der Betroffenen nicht identifizieren konnte. Während einige Anbieter von Erfolgen mit dem Tool berichteten, stellten Forscher der University of Michigan Medical School fest, dass die Ergebnisse bei der Anwendung auf ihre eigenen Patienten wesentlich ungenauer waren.

Wenn man bedenkt, wie Modelle in unterschiedlichen Umgebungen bei verschiedenen Bevölkerungsgruppen funktionieren, kann dies im Gesundheitswesen über Leben und Tod entscheiden. Aber auch in anderen Branchen ist es wichtig. Die gute Nachricht ist, dass wir darin immer besser werden. Jetzt ermöglichen wir es Benutzern, Modelle in großem Maßstab schneller und genauer als je zuvor bereitzustellen.

Multimodale Lösungen gehen über NLP hinaus auf die nächste Stufe

Die menschliche Sprache ist nicht schwarz-weiß. Wir interpretieren Bedeutungen aus geschriebener Sprache, Sprache, Bildern und mehr. Daher brauchen wir ML-Techniken, die gleichzeitig „lesen", „sehen" und „hören" können. Der Schlüssel für diese Anwendungsfälle sind multimodale Lerntechniken, die unterschiedliche Datenmodalitäten verwenden, indem sie Tools wie NLP und Computer Vision kombinieren.

Während NLP-Modelle hervorragend Text verarbeiten können, verwenden viele Real-Word-Anwendungen Dokumente mit komplexeren Formaten. Beispielsweise enthalten Gesundheitssysteme häufig visuelle Laborergebnisse, Sequenzierungsberichte, klinische Studienformulare und andere gescannte Dokumente. Wenn NLP allein zum Verständnis von Dokumenten verwendet wird, werden Layout und Stil beeinträchtigt.

Mit den neuen Fortschritten beim multimodalen Lernen können Modelle jedoch sowohl aus dem Text in Dokumenten über NLP als auch aus dem visuellen Layout durch Technologien wie Computer Vision lernen. Die Kombination mehrerer Technologien zu einer bestimmten Lösung, um bessere Ergebnisse zu erzielen, ist der Kern des multimodalen Lernens. Wir beginnen, mehr von dieser Verschiebung von der Forschung zur Produktion zu sehen.

2021 war ein herausragendes Jahr für NLP und wir können erwarten, dass dies auch im neuen Jahr anhält. Mit benutzerfreundlicheren Tools, genaueren Ergebnissen, größeren Bereitstellungen und Kombinationsmöglichkeiten mit anderen leistungsstarken KI-Technologien wird es interessant sein zu sehen, wohin uns 2022 führt.

David Talby

CTO, John Snow Labs

Ich helfe Unternehmen beim Aufbau realer KI-Systeme, die neueste wissenschaftliche Fortschritte in Produkte und Dienstleistungen umwandeln. Meine Spezialität ist die Anwendung von Machine Learning, Deep Learning und Natural Language Processing im Gesundheitswesen.