Gruppieren ähnlicher Sätze für schnelleres Absichtstraining

Bereits im Dezember 2020 haben wir erfolgreich ein leistungsstarkes NLP-Modell (Natural Language Processing) namens "SentenceTransformers" auf die schwedische Sprache erweitert. Wir hassen es zu prahlen, aber nach der Veröffentlichung des Blog-Beitrags über unsere Leistung, erhielten wir eine Menge Aufmerksamkeit 😎 So beschlossen wir, mit einem anderen spannenden Projekt mit dem schwedischen SentenceTransformers-Modell fortzufahren, in dem wir den Absichtstrainingsprozess halb automatisierenwollen, indem wir ähnliche Sätze gruppieren. Klingt kompliziert, nicht wahr? Keine Sorge, wir machen die Erklärung so einfach wie möglich, also lesen Sie bitte weiter 👀

Probleme mit dem Absichtstrainingsprozess

Wir haben bereits im letzten Beitrag erklärt, dass Ebbot Auf der Grundlage des Zwecks Ihrer Botschaften (Absichten), die er durch Beispielphrasenlernt, auf Sie reagiert. Um das beste Kundenerlebniszu bieten, verwenden wir kontinuierlich Daten aus realen Gesprächen zwischen Ebbot- und Chatbot-Nutzern – die im Schulungszentrum von Ebbot gespeichert sind –, um Ebbot neue Absichten beizubringen, oder in einigen Fällen weitere Beispiele zu liefern, um seine Genauigkeit bei der Erkennung alter Absichten zu verbessern.

Auch wenn wir viele Daten lieben, ist es für unser Customer Implementation Manager-Team manchmal extrem schwierig, Trainingsdaten für Ebbot zu sortieren, wenn es Tausende von Sätzen im Schulungszentrum gibt. Stellen Sie sich vor, durch diese vielen Sätze zu gehen und ihre Absichten zu entscheiden, es ist eine Menge Arbeit! Wenn wir nur alle ähnlichen Sätze zusammenfassen können, wird der Trainingsprozess so viel schneller sein... 🤔

Tante Absichtstraining durch Clustering sätze

Ähnlich wie bei unseren früheren Projekten haben wir Streamlit verwendet, um die ähnliche Sätze zu erstellen, die web app gruppieren. Durch die Kombination unserer schwedischen SentenceTransformers und der Community-Erkennungsfunktion von UKPLab können wir drei verschiedene Funktionen haben: Gruppieren einer Liste von mindestens fünf Sätzen und Verwendung .csv Datei, die aus dem Schulungszentrum exportiert wird, um Ergebnisse in einer anderen .csv Datei oder einer .txt-Dateizu erhalten. 

Der besondere Teil unserer App ist, dass wir unseren Spam-Klassifier nutzen, um alle Spam-Nachrichten zu entfernen und die App bietet auch eine Keyword-Vorschlag-Funktion, um die Absicht jeder Gruppe zu entscheiden. Zum Glück für uns liefert Mutli-RAKE genau das, was wir brauchen. Im Moment unterstützt RAKE bis zu 26 Sprachen, so dass Sie mit nur wenigen Codezeilen auch die gleiche Funktion haben könnten! 😉

Erlauben Sie uns, ein wenig darüber zu "zeigen", wie flexibel unsere Clustering-Funktion ist! Aus Datenschutzgründen müssen wir die Informationen im Bild unten zensieren. Wir hoffen, dass Sie verstehen👇

Unsere App ermöglicht es Ihnen, Ergebnisse als .csv Datei herunterzuladen

Auch wenn das Programm bereits reibungslos funktioniert und wir es nicht abwarten können, es für unsere Kunden in das System zu implementieren, wird es eine Weile dauern, bis es integriert ist. In der Zwischenzeit empfehlen wir Ihnen, unserem LinkedIn für wöchentliche Updates zu folgen. Oder wenn Sie Fragen haben, lassen Sie uns einen kleinen Chat haben und wir werden Ihnen mehr über uns erzählen!

Sell-Ebbot-Rosa-background-chatbot

Neugierig auf unsere Produkte?

Wenn Sie neugierig sind und mehr über Ebbot erfahren möchten oder eine Live-Demo unserer KI-Projekte sehen möchten, lassen Sie uns uns treffen und darüber sprechen! Alles, was Sie tun müssen, ist auf die Schaltfläche unten 👇

Diesen Beitrag teilen

Teilen auf facebook
Anteil auf linkedin
Teilen auf Twitter
Teilen per E-Mail

Lesen Sie mehr

Rechtschreibfehler in schwedischer Sprache automatisch korrigieren

Da unser NLP-Team von Hello Ebbot verstanden hat, dass Tippfehler einer der Gründe sein können, warum Ebbot nicht die richtige Antwort geben kann, hat es beschlossen, eine neue Funktion zur Autokorrektur von Rechtschreibfehlern zu entwickeln, insbesondere für die schwedische Sprache! Unser Rechtschreibkorrekturer berücksichtigt nicht nur den Kontext, um eine bessere Korrektur zu ermöglichen, sondern hat auch eine feste Leistung.

MEHR LESEN »