Jump to content

Erweiterung:Proofread Page

From mediawiki.org
This page is a translated version of the page Extension:Proofread Page and the translation is 84% complete.
Outdated translations are marked like this.
MediaWiki-Erweiterungen
Proofread Page
Freigabestatus: stabil
Einbindung Seitenaktivität , ContentHandler , Tag , API , Datenbank
Beschreibung The Proofread Page extension can render a book either as a column of OCR text beside a column of scanned images, or broken into its logical organization (such as chapters or poems) using transclusion.
Autor(en) ThomasV (original author)
Tpt (current maintainer)
Letzte Version continuous updates
Kompatibilitätspolitik Snapshots werden zusammen mit MediaWiki veröffentlicht. Der Master ist nicht abwärtskompatibel.
MediaWiki current master
PHP 7.0+
Datenbankänderungen Ja
Composer mediawiki/proofread-page
Tabellen pr_index
Lizenz GNU General Public License 2.0 oder neuer
Herunterladen
Hilfe Help:Extension:ProofreadPage
Beispiel s:Index:Wind in the Willows (1913).djvu
Page, Index
  • $wgProofreadPagePageJoiner
  • $wgProofreadPagePageSeparator
  • $wgProofreadPageNamespaceIds
  • $wgProofreadPageEnableEditInSequence
  • $wgProofreadPageBookNamespaces
  • $wgProofreadPageUseStatusChangeTags
  • $wgProofreadPagePageSeparatorPlaceholder

  • pagequality
  • pagequality-admin
  • pagequality-validate
Übersetze die Proofread Page-Erweiterung, wenn sie auf translatewiki.net verfügbar ist
Probleme Offene Aufgaben · Einen Fehler melden

Proofread Page extension

2020 Coolest Tool
Award Winner

in the category
Impact


Die Proofread Page-Erweiterung erstellt ein Buch entweder als:

  1. Textspalte mit OCR-Texterkennung neben einer Spalte mit gescannten Bildern oder
  2. getrennt in Kapiteln bzw. Gedichten. Der Inhalt eines Dokuments erscheint in der MediaWiki-Seite (über Transklusion).

Die Erweiterung soll einen einfachen Vergleich des Textes mit der Digitalisierung des Originals ermöglichen.

Diese Erweiterung zeigt den Text auf verschiedene Arten an, ohne den Originaltext zu vervielfältigen.[1]

Verwendung

Die Erweiterung ist auf allen Wikisource-Wikis installiert. Für die Syntax siehe $1. Es wurde auch auf Bibliowiki verwendet.

Voraussetzungen und Empfehlungen

  • Der Zugriff auf die Kommandozeile ist erforderlich, wenn das Ausführen des Update-Skripts (maintenance/update.php) über den Webbrowser fehlschlägt (Dokumentation hier und hier).


Installation

Erweiterung

  • Die Erweiterung herunterladen und die Datei(en) in ein Verzeichnis namens ProofreadPage im Ordner extensions/ ablegen.
    Entwickler und Code-Beitragende sollten stattdessen die Erweiterung von Git installieren, mit:cd extensions/
    git clone https://gerrit.wikimedia.org/r/mediawiki/extensions/ProofreadPage
  • Folgenden Code am Ende deiner LocalSettings.php -Datei einfügen:
    wfLoadExtension( 'ProofreadPage' );
    
  • Führe das Aktualisierungsskript aus, welches automatisch die notwendigen Datenbanktabellen erstellt, die diese Erweiterung braucht.
  • Yes Erledigt – Navigiere zu Special:Version in deinem Wiki, um zu überprüfen, ob die Erweiterung erfolgreich installiert wurde.

Daumennageln

Die Erweiterung verlinkt direkt auf Bild-Thumbnails, die oft nicht vorhanden sind. Du musst 404-Fehler abfangen und die fehlenden Vorschaubilder erstellen. Du kannst dies mit jeder dieser Lösungen tun:

  • Lege einen Apache RewriteRule in .htaccess bis thumb.php für fehlende Thumbnails fest:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb.php?f=$1&p=$2&w=$3 [L,QSA]
  • oder lege den Apache 404 Handler auf Wikimedia's thumb-handler fest. Dies ist ein allgemeiner 404-Handler mit Wikimedia-spezifischem Code, "nicht" einfach ein Thumbnail-Generator.
    ErrorDocument 404 /w/extensions/upload-scripts/404.php
  • Bei MediaWiki >= 1.20 kannst du einfach auf thumb_handler.php umleiten:
    RewriteEngine On
    RewriteCond %{REQUEST_FILENAME} !-f
    RewriteCond %{REQUEST_FILENAME} !-d
    RewriteRule ^/w/images/thumb/[0-9a-f]/[0-9a-f][0-9a-f]/([^/]+)/page([0-9]+)-?([0-9]+)px-.*$ /w/thumb_handler.php [L,QSA]
  • Oder in apache2.conf:
    ErrorDocument 404 /w/thumb_handler.php
Warnung Warnung: Im images-Verzeichnis existiert eine .htaccess-Datei, die möglicherweise mit den .htaccess-Regeln, die du installierst, kollidiert.

If you encounter a problem similar to the following:

  • phab:T301291PDF and DjVu files on Commons failed to be processed (no thumbnails, zero pages) but otherwise valid
  • phab:T298417Undeleted DjVu files show incorrect metadata: 0x0 size, no page number info
  • phab:T299521PDF file has 0x0 image size in Commons after uploading a new version while the page number is correct

Try next steps:

  1. repair thumbnails for DjVu files of the core MediaWiki (for PDF use mimetype application/pdf )
    php maintenance/refreshImageMetadata.php --verbose --mime image/vnd.djvu --force
    
  2. needed for actualization info about the pages counts of the Special:IndexPages
    php maintenance/refreshLinks.php --namespace 252
    

Namensräume

ProofreadPage erstellt standardmäßig zwei benutzerdefinierte Namespaces mit den Namen "Page" und "Index" auf Englisch mit den IDs 250 bzw. 252.

Ihre Namen werden übersetzt, wenn dein Wiki eine andere Sprache verwendet. Vollständige Liste.

Du kannst ihren Namen oder ihre ID anpassen: Namespaces von Hand erstellen und ihre IDs in Manual:LocalSettings.php mit $wgProofreadPageNamespaceIds global festlegen. Du tust dann so etwas wie:

define( 'NS_PROOFREAD_PAGE', 250);
define( 'NS_PROOFREAD_PAGE_TALK', 251);
define( 'NS_PROOFREAD_INDEX', 252);
define( 'NS_PROOFREAD_INDEX_TALK', 253);
$wgExtraNamespaces[NS_PROOFREAD_PAGE] = 'Page';
$wgExtraNamespaces[NS_PROOFREAD_PAGE_TALK] = 'Page_talk';
$wgExtraNamespaces[NS_PROOFREAD_INDEX] = 'Index';
$wgExtraNamespaces[NS_PROOFREAD_INDEX_TALK] = 'Index_talk';
$wgProofreadPageNamespaceIds = array(
    'index' => NS_PROOFREAD_INDEX,
    'page' => NS_PROOFREAD_PAGE
);

Die Anpassung der Namespace-ID wird nicht empfohlen und wird möglicherweise auch in Zukunft nicht unterstützt.

Konfiguration

Konfiguration des Index-Namensraumes

Für mehr Details siehe Extension:Proofread Page/Index data configuration

Die Konfiguration ist ein JSON-Array mit Eigenschaften. Hier ist die Struktur einer Eigenschaft im Array, alle Parameter sind optional, der Standardwert ist festgelegt:

{
  "ID": { //id of the metadata (first parameter of proofreadpage_index_attributes)
    "type": "string", //the property type (for compatibility reasons the values have not to be of this type). Possibles values: string, number, page. If set, the newly set values should be valid according to the type (e.g. for a number a valid number, for a page an existing wiki page...)
    "size": 1, //only for the type string : number of lines of the input (third parameter of proofreadpage_index_attributes)
    "values":  {"a":"A", "b":"B","c":"C", "d":"D"}, //an array values : label that list the possible values (for compatibility reasons the stored values have not to be one of these)
    "default": "", //the default value
    "header": false, //add the property to MediaWiki:Proofreadpage_header_template template (true is equivalent to being listed in proofreadpage_js_attributes)
    "label": "ID", //the label in the form (second parameter of proofreadpage_index_attributes)
    "help": "", //a short help text
    "delimiter": [], //list of delimiters between two part of values. By example ["; ", " and "] for strings like "J. M. Dent; E. P. Dutton and A. D. Robert"
    "data": "" //proofreadpage's metadata type that the property is equivalent to
  }
}

Der Datenparameter kann einen Wert haben: "type", "language", "title", "author", "translator", "illustrator", "editor", "school", "year", "publisher", "place", "progress"

Seitentrenner

Die Erweiterung setzt ein Trennzeichen zwischen jede transkludierte Seite und die nächste, das durch wgProofreadPagePageSeparator definiert ist. Der Standardwert ist   (ein Leerzeichen). Lege wgProofreadPagePageSeparator = "" fest, um das Trennzeichen zu unterdrücken.

Wörter mit Bindestrich seitenübergreifend verbinden

Wenn ein Wort zwischen einer Seite und der nächsten mit einem Bindestrich getrennt wird, verbindet die Erweiterung die beiden Worthälften miteinander. Beispiel: his- und tory wird zu Geschichte. Das "Verbindungszeichen" wird durch wgProofreadPagePageJoiner definiert und ist standardmäßig '-' (der ASCII-Bindestrich).

Konfiguriere die Änderungsmarkierung (optional)

Siehe Änderungsmarkierung, um Änderungsmarkierungen festzulegen.

Verwendung

Erstellen deiner ersten Seite (Beispiel mit DjVu)

  • Bevor du diese Schritte ausführst, vergewissere dich, dass du die Anweisungen in Handbuch:Wie man DjVu mit MediaWiki verwendet befolgt hast.
  • (wann und in welchen Namespace wird die djvu-Datei selbst hochgeladen?)
  • Erstelle eine Seite im Namensraum "Page" (oder den internationalisierten Namen, wenn du ein nicht-englisches Wiki verwendest). Wenn dein Namespace zum Beispiel 'Page' ist, erstelle Page:Carroll - Alice's Adventures in Wonderland.djvu
  • Erstelle die entsprechende Datei für diese Seite commons:File:Carroll - Alice's Adventures in Wonderland.djvu (oder lege Handbuch:$wgUseInstantCommons auf true fest).
  • Erstelle die Index-Seite Index:Carroll - Alice's Adventures in Wonderland.djvu
    • Füge den Tag ‎<pagelist /> in das Feld Seiten ein, um die Seitenliste zu visualisieren
  • Um Seite 5 des Buches zu bearbeiten, navigiere zu 'Page:Carroll - Alice's Adventures in Wonderland/5' und klicke auf Bearbeiten.

Syntax

Diese Erweiterung führt die folgenden Tags ein: ‎<pages>, ‎<pagelist>

Anmerkungen

  1. Da die Seiten nicht im Hauptnamensraum liegen, werden sie bei der statistischen Zählung der Texteinheiten nicht berücksichtigt.

Siehe auch