Autokorrektur-Rechtschreib-Banner
Autokorrektur-Rechtschreib-Banner

Rechtschreibfehler in schwedischer Sprache automatisch korrigieren

Als Menschen ist es für uns einfach, Textnachrichten zu verstehen, die Rechtschreibfehler enthalten. Aber wissen Sie, dass Ebbot manchmal Nachrichten verstehen kann, wenn es zu viele falsch gespielte Wörter gibt? Da unser NLP-Team von Hello Ebbot verstanden hat, dass Tippfehler einer der Gründe sein können, warum Ebbot nicht die richtige Antwort geben kann, hat es beschlossen, eine neue Funktion zur Autokorrektur von Rechtschreibfehlern zu entwickeln, insbesondere für die schwedische Sprache! Unser Rechtschreibkorrekturer berücksichtigt nicht nur den Kontext, um eine bessere Korrektur zu ermöglichen, sondern hat auch eine feste Leistung. In diesem Blogbeitrag verraten wir Ihnen unser kleines Geheimnis, um dieses Ergebnis zu erzielen 🤖

Ebbots Antwort vor der Rechtschreibprüfung
Ebbots Antwort nach der Rechtschreibprüfung

Einführung in Jamspell - eine Rechtschreibprüfungsbibliothek

Jamspell ist eine Open-Source-Bibliothek für Rechtschreibfehler. Es ist in C ++ geschrieben, aber in vielen anderen Programmiersprachen verfügbar, indem swig verwendet wird - ein Software-Tool, das verwendet wird, um in C oder C ++ geschriebene Bibliotheken mit anderen Sprachen wie Python, PHP, Javascript zu verbinden ...

Darüber hinaus ist es sehr einfach, ein benutzerdefiniertes Modell zu trainieren, um die Sprache Ihrer Wahl zu unterstützen. Um Jamspell an eine neue Sprache anzupassen, benötigen Sie zwei utf-8-Dateien, eine ist das Alphabet.txt das das Alphabet der Sprache enthält, und die andere ist ein Korpus von Sätzen, die trainiert werden müssen. Da der Zweck des Trainingsprozesses darin besteht, dem Modell beizubringen, wie Wörter richtig geschrieben werden, wird empfohlen, einen Korpus mit minimalen Rechtschreibfehlern zu verwenden. In unserem Fall haben wir OpenSubtitles als Trainingskorpus gewählt, aber es gibt auch andere Optionen zur Auswahl, wie Wikipedia oder Literaturdokumente. Detaillierte Schritte, um dies zu erreichen, finden Sie auf Jamspells Github.

Wie Jamspell die Rechtschreibprüfung in schwedischer Sprache durchführt

Um dies einfach in unsere Anwendungen zu integrieren, entschied sich unser NLP-Team, das Modell mit FastAPIin eine API zu packen. Aus Sicherheitsgründen können wir den Zugriff auf die API leider nicht öffentlich teilen. Aber hier sind einige extrem herausfordernde Beispiele, die unser Modell erfolgreich korrigiert hat, die wir Ihnen zeigen möchten 👇

Original
  1. Jdg springwr mwd mein Hund jeden Tag
  2. Vusstw du toll Beispiel, dass es auch 5.000 etwasurrrservat in Svetihe gibt?
  3. Jqg sie immer noch intw bekommt meine ordwr
korrigiert
  1. Ich laufe jeden Tag mit meinem Hund
  2. Wussten Sie zum Beispiel, dass es in Schweden über 5.000 Naturschutzgebiete gibt?
  3. Ich habe meine Bestellung immer noch nicht erhalten.

Nun, das nennen wir 🪄 Magie! Wir arbeiten daran, dies in die Fähigkeiten von Ebbot zu integrieren, aber wissen Sie, dass wir bereits eine magische Spülmaschine zur Verfügung haben? Wenn Sie mehr über diese spezielle Spülmaschine erfahren möchten, zögern Sie nicht, uns zu kontaktieren! Wir sehen uns in unserer nächsten Zaubershow... 🧙 ♀️

Sell-Ebbot-Rosa-background-chatbot

Neugierig auf Ebbot?

Wenn Sie mehr darüber erfahren möchten, wie Ebbot – ein hilfsbereiter digitaler Mitarbeiter – Ihnen helfen kann, dann treffen wir uns und sprechen Sie darüber! Alles, was Sie tun müssen, ist auf die Schaltfläche unten 👇

Diesen Beitrag teilen

Teilen auf facebook
Anteil auf linkedin
Teilen auf Twitter
Teilen per E-Mail

Lesen Sie mehr

Paraphrase-Fragen auf Schwedisch mit T5

Nach einem Monat der Vorbereitung des Datensatzes und der Schulung präsentieren wir Ihnen stolz ein T5-Modell (Text-To-Text Transfer Transfromer), das alle Fragen in schwedischer Sprache umschreibt. Indem wir aus paraphrasierten Fragen des schwedischen T5 lernen, beschränken wir uns nicht mehr nur auf die Themen in unserer aktuellen Fragendatenbank.

MEHR LESEN »