Beispiel für die Anwendung zur Satzähnlichkeit
Beispiel für die Anwendung zur Satzähnlichkeit

Erweitern von SentenceTransformers auf die schwedische Sprache

Die Geschichte des NLP-Teams von Hello Ebbot, das SentenceTransformers auf Schwedisch ausdehnte, begann vor einem Monat, als wir unerwartet einen Anruf vom Weihnachtsmann erhielten...

🎅🏼 Santa: Hallo, ist das Hello Ebbots NLP-Team? Es ist der Weihnachtsmann sprechen! Hallo Ebbot ist auf der Nizza-Liste in diesem Jahr und ich habe ein Geschenk für Sie.

👾 Hallo Ebbot Team: Oh Santa!! Wirklich, Sie haben ein Geschenk für uns?

🎅🏼 Santa: Ja, natürlich haben Sie alle im Jahr 2020 sehr hart gearbeitet. Wie kann ich dazu beitragen, Ihre Arbeitslast zu reduzieren?

👾 Hallo Ebbot Team: Hmm, es gibt eigentlich eine Sache, die wir jetzt verbessern wollen! Damit unser digitaler Mitarbeiter also auf die Menschliche Sprache reagieren kann, muss er geschult werden, Absichten zu erkennen,was im Grunde der Zweck einer Botschaft ist. Dann lernt er, wie man es durch 10-20 Beispielsätze für jede Absicht genau vorhersagt. Es wäre schön, wenn wir eine Anwendung haben können, die einen Satz als Eingabe nimmt und viele Sätze mit der gleichen Bedeutung ausgibt, so dass wir diese Beispiele nicht selbst finden müssen.

🎅🏼 Santa: Aaah, dann weiß ich genau, was du brauchst, wie wäre es mit meinem intelligenten SentenceTransformers-Modell? Er kann Ihnen helfen, die Sätze in Zahlen zu übersetzen, und Sie können Kosinusähnlichkeit verwenden, um ähnliche Sätze in einem großen Korpus zu finden.

👾 Hallo Ebbot Team: Das ist geil! Wir bereiten und reinigen unsere Liste der Beispielsätze in unserer Datenbank und warten auf Ihr Geschenk!

🎅🏼 Santa: Ein kleines Problem, Sie müssen SentenceTransformers Englisch lehren! Er spricht nur Englisch.

👾 Hallo Ebbot Team: Das ist okay Santa, wir wissen, dass Sie mit anderen Unternehmen auf der schönen Liste sprechen müssen. Lassen Sie uns von hier aus dafür sorgen.

Das war, als wir beschlossen, die SentenceTransformers zu trainieren, damit das Modell schwedischen Text einbetten kann. Und schließlich, nach stundenweisem Training und vielen Tassen Kaffee später...
SentenceTransformers spricht jetzt fließend Schwedisch! 🥳 🎉

 

Wie wir SentenceTransformers auf Schwedisch ausdehnten

Basierend auf der Publikation"Making Monolingual Sentence Embeddings Multilingual using Knowledge Distillation" haben wir die "lehrer" English SentenceTransformers auf ein "schülerisches" schwedisches Modell mit dem Datensatz "Englisch – Schwedisch parallele Sätze" erweitert, der TED2020-Korpus mit 119.602 Sätzenenthielt. Wir haben unseren Transformer basierend auf dem Beispiel-Trainingsskript von UKPLab mit dem Colab Pro-Notebook trainiert. Mit Hilfe der Graphics Processing Unit (GPU) von Colab Pro brauchten wir nur zwei Stunden, um zu trainieren, und wir erreichten die Genauigkeit von 95,6 %, die am Testsatz ausgewertet wurden.

Hallo Ebbots Anwendung, die mit SentenceTransformers erstellt wurde

Nach Abschluss der Verlängerung SentenceTransformers To Swedish, wir verwendeten das Modell, um unseren Korpuseinzubetten, das ist eine gereinigte Liste von 56.538 Beispielphrasen, die wir in der Vergangenheit für Ebbot herausgearbeitet haben. Dann wurde die Kosinusähnlichkeit angewendet, um die semantische Ähnlichkeit zwischen dem gegebenen Text und den Sätzen im Korpus zu vergleichen. Die Anwendung druckt dann die ähnlichsten Sätze zusammen mit Ähnlichkeitswerten aus.
Mit Streamlit hat unser NLP-Team eine einfache Web-App erstellt, mit der Benutzer auswählen können, wie viele ähnliche Phrasen sie generieren möchten. Es gibt auch eine Option zum Ausdrucken von Top-ähnlichen oder allen Sätzen innerhalb eines gewählten Prozentsatzes.

Werfen wir einen Blick auf weitere Beispiele!

  1. fragen, wenn Sie wegschicken, was ich bei Ihnen bestellt habe (Ergebnis: 0.93)
  2. Ich frage mich, wann ich das Zeug bekomme, das ich bestellt habe (Ergebnis: 0.91)
  3. Hallo Ich habe Waren aus Ihnen bestellt hat sich gefragt, wo der Rest ging (Score: 0.90)
  4. wann bekomme ich meine bestellte Ware (Ergebnis: 0,89)
  5. Wann bekomme ich mein Paket, das ich bestellt habe (Ergebnis: 0.89)
  6. wann muss ich die Bestellung herunterladen (Ergebnis: 0.89)
  7. Wann werden Dinge ankommen, die ich bestelle (Ergebnis: 0.88)
  8. wenn meine Bestellung gesendet wird (Ergebnis: 0.88)
  9. und du fragst dich, wie ich es machen soll, du schickst jemanden hierher, um es abzuholen, als ich zu Hause zuliefern hatte (Ergebnis: 0.88)
  10. Wo sind meine Sachen, die ich bestellt habe (Ergebnis: 0.88)
  1. großer Dank für all die Hilfe, um es gut zu haben (Ergebnis: 0.98)
  2. Super gut vielen Dank für Ihre Hilfe (Ergebnis: 0.98)
  3. top vielen Dank für Ihre Hilfe (Ergebnis: 0.98)
  4. Top danke für Ihre Hilfe 👍🏾 (Ergebnis: 0.98)
  5. Danke für die Hilfe haben es so gut (Ergebnis: 0.98)
  6. vielen Dank, dass Sie sehr hilfreich waren (Ergebnis: 0,98)
  7. perfektes Dankeschön für die Hilfe (Ergebnis: 0,98)
  8. Top danke für guten Service (Ergebnis: 0.98)
  9. oh top danke für ihre Hilfe (Score: 0.98)
  10. herzlichen Dank für Ihre Hilfe

Sie können sehen, dass die Anwendung nicht nur andere Sätze mit ähnlichen Wörtern findet, sondern tatsächlich in der Lage ist, Sätze mit der gleichen Bedeutung zurückzugeben. Das macht die SentenceTransformers zu einem leistungsstarken und hilfreichen Werkzeug für uns, denn Je kreativer wir mit den Beispielphrasen sind, desto besser werden Ebbot bei der Erkennung von Absichten!

Da der Weihnachtsmann sehr aufgeregt über unser Ergebnis 🎅🏼 war, rief er uns zu und fragte, wann wir die Anwendung für den Einsatz in der Produktion bereit haben. Obwohl wir stolz auf uns selbst sind, dass wir SentenceTransformerserfolgreich auf Schwedisch ausdehnen, haben wir ihm gesagt, dass wir es noch intern testen und vor der offiziellen Veröffentlichung Verbesserungen vornehmen wollen. Wir bedankten uns noch einmal bei Santa 🎅🏼 und versprachen ihm, dass wir im Jahr 2021 noch fleißiger sein werden, um weiterhin auf der schönen Liste 🎄 und so beginnt Hello Ebbots Reise für das Jahr 2021....

Sell-Ebbot-Rosa-background-chatbot

Möchten Sie mehr darüber erfahren, warum der Weihnachtsmann uns kontaktiert hat?

Wenn Sie neugierig sind und mehr darüber wissen möchten, wie Hello Ebbot es auf die schöne Liste des Weihnachtsmannes geschafft hat, lassen Sie uns uns treffen und darüber sprechen! Alles, was Sie tun müssen, ist auf die Schaltfläche unten 👇

Diesen Beitrag teilen

Teilen auf facebook
Anteil auf linkedin
Teilen auf Twitter
Teilen per E-Mail

Lesen Sie mehr

Rechtschreibfehler in schwedischer Sprache automatisch korrigieren

Da unser NLP-Team von Hello Ebbot verstanden hat, dass Tippfehler einer der Gründe sein können, warum Ebbot nicht die richtige Antwort geben kann, hat es beschlossen, eine neue Funktion zur Autokorrektur von Rechtschreibfehlern zu entwickeln, insbesondere für die schwedische Sprache! Unser Rechtschreibkorrekturer berücksichtigt nicht nur den Kontext, um eine bessere Korrektur zu ermöglichen, sondern hat auch eine feste Leistung.

MEHR LESEN »