Jump to content

Hilfe:Inhaltsübersetzung/Übersetzen/Erste maschinelle Übersetzung

From mediawiki.org
This page is a translated version of the page Help:Content translation/Translating/Initial machine translation and the translation is 100% complete.
PD Hinweis: Wenn Du diese Seite bearbeitest, stimmst Du zu, dass Dein Beitrag unter der [CC0] veröffentlicht wird. Mehr Informationen findest du auf der Public Domain Hilfeseite. PD

Wenn du der Übersetzung einen neuen Absatz hinzufügen, kannst du bei Null anfangen oder eine automatische Übersetzung als Ausgangspunkt verwenden. Wenn verfügbar, wird die maschinelle Übersetzung standardmäßig als Erstübersetzung verwendet. Die verschiedenen Optionen, die Einzelheiten zu ihrer Verfügbarkeit und die Überlegungen bei der Verwendung der maschinellen Übersetzung werden im Folgenden beschrieben.

Optionen für die Erstübersetzung

Die Optionen "Erstübersetzung" in der Spalte "Werkzeuge" ermöglichen es dir, den anfänglichen Inhalt zu bestimmen, der als Ausgangspunkt für jeden Absatz verwendet werden soll. Folgende Optionen stehen zur Verfügung:

  • Einen maschinellen Übersetzungsdienst verwenden. Damit kannst du mit einer automatisch übersetzten Version des Originalabsatzes beginnen. Die Anzahl und Bezeichnung dieser Optionen wird variieren. Optionen wie "Apertium verwenden" oder "Yandex verwenden" werden je nach den für diese Dienste unterstützten Sprachen verfügbar sein (mehr dazu im nächsten Abschnitt).
  • Den ursprünglichen Inhalt kopieren. Der ursprüngliche Absatz wird in die Übersetzung übernommen. Obwohl der Inhalt in der Originalsprache bleibt, werden einige Elemente an das Ziel-Wiki angepasst. Beispielsweise verweisen Links auf den entsprechenden Artikel in der Zielsprache, und Vorlagen werden in die entsprechenden umgewandelt. Die Übersetzer müssen den Inhalt nach wie vor vollständig neu schreiben, aber die angepassten Elemente lassen sich möglicherweise leichter wiederverwenden.
  • Mit einem leeren Absatz beginnen. Mit einem leeren Absatz zu beginnen, kann in Fällen nützlich sein, in denen der alternative Inhalt mehr Arbeit als nur die Eingabe erfordert.

Du kannst bei jedem Absatz schnell und unabhängig voneinander zwischen den verschiedenen Ansätzen wechseln, da jeder dieser Ansätze bei verschiedenen Arten von Inhalten am besten funktionieren kann. Wenn du zwischen den verschiedenen Ansätzen wechselst, bleiben die Änderungen, die du am Absatz vorgenommen hast, erhalten. Auf diese Weise kannst du einen anderen Ansatz ausprobieren, selbst wenn du mit der Bearbeitung des ursprünglichen Ansatzes begonnen hast, ohne die Angst haben zu müssen, deine Änderungen zu verlieren, wenn du dich schließlich entscheidest, zum ursprünglichen Ansatz zurückzukehren. In diesem Zusammenhang sind zwei zusätzliche Optionen relevant:

  • Die Option zum Zurücksetzen der Übersetzung steht zur Verfügung, wenn du Modifikationen am ursprünglich bereitgestellten Inhalt vorgenommen hast. Sie ermöglicht es dir, den ursprünglichen Inhalt wiederherzustellen, indem deine Änderungen verworfen werden.
  • Die Option Als Standard markieren ist verfügbar, wenn du einen Ansatz für einen Absatz wählst, der nicht der Standard ist. Sie ermöglicht es dir, den Standardansatz für die nächsten Absätze festzulegen, die der Übersetzung hinzugefügt werden. Dies kann sehr praktisch sein, wenn du festgestellt hast, dass ein bestimmter Übersetzungsdienst im Allgemeinen besser funktioniert als der Standarddienst.

Verfügbarkeit maschineller Übersetzungen

Die Inhaltsübersetzung integriert mehrere Übersetzungsdienste, und jeder Dienst unterstützt unterschiedliche Sprachen. Die unterstützten Dienste sind unten mit einem Link zu der Liste der von ihnen unterstützten Sprachen aufgeführt:

Die Liste der oben genannten Sprachen verweist auf den Konfigurationscode, um sicherzustellen, dass die Informationen mit der aktuellen Funktionsweise des Tools synchronisiert sind. Die Liste zeigt den Sprachcode für die Ausgangssprache und eingerückt die unterstützten Zielsprachen darunter.

Du kannst auch die verfügbaren Dienste für ein bestimmtes Sprachenpaar mit Hilfe unserer APIs überprüfen. In diesem Beispiel für das spanisch-katalanische Paar kannst du sehen, dass Apertium der Standarddienst (der erste in der Liste) unter den anderen verfügbaren Diensten ist.

Sprachen werden stufenweise freigeschaltet, basierend auf den beobachteten Ergebnissen und dem Community-Feedback. Es ist möglich, dass Maschinenübersetzung noch nicht freigeschaltet sind, selbst wenn sie von von den zugrundeliegenden Diensten unterstützt werden.

Bestehende Übersetzungsdienste verbessern

Wenn du eine Übersetzung mit Inhaltsübersetzung veröffentlichst, hilfst du den Übersetzungsdiensten bereits, sich zu verbessern. Alle Berichtigungen, die du an den ersten Maschinenübersetzungen machst, werden über API und Downloads zur Verfügung gestellt und können möglicherweise benutzt werden, um bestehende Dienste zu verbessern. Darüber hinaus bieten einige der oben genannten Übersetzungsdienste spezielle Möglichkeiten, wie du zu ihren Projekten beitragen kannst.

MinT

The translations provided by MinT are based on translation models such as NLLB-200 and OpusMT. The training data compiled by the Opus project is resused by many translation models, and you can contribute to it in order to help improve the translation quality for your language.

OpusMT ist ein quelloffenes neuronales maschinelles Übersetzungssystem, das mit mehrsprachigen Dokumenten trainiert wird, frei lizenziert und online verfügbar ist. Dieser offene Datenbestand wird verwendet, um das Übersetzungssystem zu trainieren, und eine Erweiterung des Datenbestands wird zu besseren Übersetzungen führen. Die durch die Verwendung von Content Translation generierten Inhalte sind automatisch in den Datenbestand integriert, aber du kannst dazu beitragen, den Datenbestand weiter auszubauen:

  • Schlage neue Quellen vor, die in den offenen Datenbestand integriert werden sollen. Du kannst Jörg Tiedemann kontaktieren, um eine neue Datenquelle zur Erweiterung des Datenbestands vorzuschlagen.
  • Dokumente direkt einreichen (noch ein vorläufiger Prototyp). Du kannst übersetzte Dokumente in verschiedenen Formaten hochladen, einschließlich übersetzter Webseiten, die in den Datenbestand aufgenommen werden sollen.
  • Sprachmodelle lokal ausprobieren mit OPUS-CAT (verfügbar für Windows)
  • Beteilige dich an anderen Projekten, die ihre Übersetzungen zu diesem offenen Sprachkorpus beisteuern, wie z. B. Tatoeba, einer offenen Online-Community, die Übersetzungen von Sätzen in vielen Sprachen sammelt.

OpusMT basiert auf MarianNMT, das ebenfalls ein Open-Source-Projekt ist. Menschen mit technischem Wissen und Interesse an maschinellem Lernen können ebenfalls dazu beitragen, die Software zu verbessern.

Apertium

Apertium ist ein quelloffenes, regelbasiertes Übersetzungssystem. Du kannst zu dem Projekt beitragen, indem du die Sprachregeln deiner Sprache kodierst. Dieser Prozess erfordert sowohl linguistische als auch fortgeschrittene technische Kenntnisse, aber du kannst vom Apertium-Team Unterstützung erhalten, um die Übersetzungsunterstützung für ein neues Sprachpaar zu erweitern.

Google Translate

Google Translate ist kein Open-Source-Projekt, aber es gibt dennoch Möglichkeiten für die Nutzer, einen Beitrag zu leisten:

Ausweitung der Sprachunterstützung mit neuen Übersetzungsdiensten

Die Inhaltsübersetzung wurde als erweiterbare Plattform konzipiert. So ist es möglich, neue Clients zu entwickeln, um zusätzliche Übersetzungsdienste zu integrieren. Einige Überlegungen zur Art und Weise, wie Übersetzungsdienste integriert werden:

  • Die maschinellen Übersetzungen und die von den Nutzern vorgenommenen Korrekturen werden als Teil der Daten zu veröffentlichten Übersetzungen veröffentlicht, die eine nützliche Quelle für die Erstellung oder Verbesserung deines Übersetzungsdienstes darstellen können.
  • Externe Dienste, die integriert sind, erhalten nur öffentlich zugängliche Wiki-Inhalte und geben eine übersetzte Version dieser Inhalte zurück, die mit den im Wiki verwendeten Lizenzen kompatibel ist. Es werden keine persönlichen Informationen mit den Übersetzungsdiensten geteilt.

Rückmeldungen zum Support, der für jede Sprache angeboten wird, ist sehr nützlich. Bitte teile uns mit, wenn du die Unterstützung für eine bestimmte Sprache vermisst oder ob es für diese Sprache höherwertige Optionen gibt. Du kannst solches Feedback auf der Projekt-Diskussionsseite oder mit einem Ticket abgeben.


Überlegungen zur maschinellen Übersetzung

Die maschinelle Übersetzung ist bei weitem nicht perfekt, wenn sie als Endergebnis gedacht ist. Trotzdem können es viele Benutzer sehr nützlich als Startpunkt empfinden. Bitte überprüfe den Inhalt unbedingt aus diesen verschiedenen Perspektiven:

  • Stelle sicher, dass die ursprüngliche Bedeutung erhalten bleibt.
  • Überprüfe, dass keine Information fehlt, insbesondere für solche Elemente wie Links, Einzelnachweise und Vorlagen, die Informationen enthalten, die nicht immer direkt in der Übersetzung auf der Oberfläche zu sehen ist.
  • Lese den übersetzten Inhalt, um sicherzustellen, dass er sich wie eine eigenständige Seite liest.

Einschränkungen bei komplexen Elementen

In manchen Fällen kann der Inhalt nicht so in der Übersetzung herauskommen, wie man es erwartet:

  • Einige der unterstützten Dienste arbeiten nur mit reinem Text. Das bedeutet, dass Formatierungen und Rich-Content-Elemente wie Links und Zitate aus dem Originalartikel in der Übersetzung verloren gehen und die Inhaltsübersetzung erraten muss, wo diese im übersetzten Text hingehören. Das erneute Hinzufügen dieser Elemente ist nicht immer perfekt, und einige Elemente können sich an der falschen Stelle befinden oder auf den falschen Teil des Textes angewendet werden.
  • Komplexe Elemente, wie Einzelnachweise oder Vorlagen, können in den unterschiedlichen Sprachen eine unterschiedliche Struktur besitzen, die es erschwert, den Inhalt von einer in die andere Sprache zu übertragen. Überprüfe unbedingt den Inhalt dieser Elemente, um sicherzustellen, dass keine wichtigen Informationen fehlen.

Durchsetzung der Überprüfung der maschinellen Übersetzung

Es gibt mehrere automatische Mechanismen zur Erzwingung der Überprüfung des ursprünglichen Inhalts. Auf diese Weise stellt das Tool sicher, dass die erste automatische Übersetzung ausreichend überprüft wird, bevor die Inhalte veröffentlicht werden.