In Antwort auf Sprachwechsel in WordPress von Robert Lender

Die Sprachauszeichnung von Textausschnitten in WordPress zu ändern, ist in der Tat schwierig. Ich mache das immer manuell. Sprachunterstützung scheint generell davon auszugehen, dass man immer nur eine Sprache verwendet, oder wenn man die Sprache wechselt, dass man immer nur eine Sprache zugleich verwendet. Der Gedanke, dass man zwei oder mehr Sprachen austauschbar verwenden kann scheint unvorstellbar zu sein. Ganz zu schweigen davon dass man dies innerhalb eines einzigen Beitrags tut oder dass man ein einziges Wort oder einen kurzen Satz in einer anderen Sprache verwendet als in denen man normalerweise schreibt.

Die Einstellung einer Sprache in WordPress ist eine seitenweite Einstellung. Das manuelle auszeichnen der Sprache ist der einzig zuverlässige Weg.

Damit ist es aber noch nicht getan. Wenn man sich ansieht wie z. B. Google Translate Inhalte analysiert, wird es schnell merkwürdig. Google achtet nur auf die für die ganze Webseite angegebene Sprache und berechnet eine algorithmische Wahrscheinlichkeit bez. die Sprache des Textes. Alle anderen Sprachauszeichnungen werden einfach ignoriert. Und selbst dann liegt Google oft falsch. Wenn ich auf einer individuellen Page, die als niederländisch deklariert ist, einen kurzen Beitrag auf Niederländisch schreibe, wird er trotzdem als Englisch interpretiert, weil die Menüstruktur auf meinen Seiten auf Englisch ist und mehr Gewicht zugewiesen bekommt als der Text selbst. Nur wenn es einen längeren niederländischen Text gibt, wird der Beitrag trotz korrekter Sprachauszeichnung der kürzere Texte, korrekt als niederländisch erkannt.

Vor einiger Zeit habe ich mein WordPress-Theme so angepasst, dass es Sprachen besser berücksichtigt:

  • Wenn ein Beitrag auf Deutsch oder Niederländisch ist, und einzeln betrachtet wird, wird die richtige Sprache als Sprache für die ganze Webseite angezeigt.
  • Wenn ein Beitrag auf Deutsch oder Niederländisch ist, wird er in einer Übersicht zusammen mit englischen Beiträge mit einer Sprachauszeichnung auf Post-ebene versehen. Beides mache ich, indem ich für jede Sprache eine eigene Kategorie verwende.
  • Kurze Sätze in einer anderen Sprache markiere ich mit einer Sprachauszeichnung, die ich leicht mit einer Tastenkombination hinzufügen kann.
  • In meinem RSS-Feed füge ich Links zur Maschinenübersetzung deutscher und niederländischer Beiträge ins Englische hinzu, erstelle sie aber als spezifische Links: Man kann sich nicht darauf verlassen dass die automatische Erkennungsfunktion von Google Translate dies richtig macht.

Kurz gesagt, ich bin nicht zuversichtlich, dass WordPress es richtig machen wird. Diese Diskussion ist kein neues Phänomen, und ein branchenweites Problem in der Tech Industrie. Vielleicht sollten gerade Coder in Europa mit unserer Sprachenvielfalt sich auf ein gut funktionierendes WP Plugin konzentrieren.

Die Auszeichnung des Sprachwechsels ist eigentlich keine Kleinigkeit. Denn immerhin geht es darum, dass z.B. Screenreader sehbehinderten Menschen Wörter richtig vorlesen und diese somit überhaupt verständlich sind. .[Was man] bis heute für einzelne Worte nicht machen kann. …da hoffe ich in Zukunft auf mehr Einsicht bei den WordPress Entwicklern.

Robert Lender

This is a worthwile question I asked exactly a year ago that bears repeating:

Can you help me find additional blogs to follow? I am looking to broaden the scope of blogs in my reader. That broadening has two main dimensions: language and geography. Right now, because they’re often easier to find, and more regularly linked to, my feed reader is heavily anglosphere centric.

Some specifications for the type of blogs I am looking for:

  • Individual or group authored blogs, not company or organisational blogs. A blog maintained by a research group is an acceptable ‘in-between’ version. The reason is I see blogging as distributed conversations. Companies don’t have conversations. As a result I follow people, not blogs, in my feedreader
  • Some thematic overlap with my interests is needed, something to have those distributed conversations around. Such interests are: making, open data/source/access/everything, agency, civic tech, ethics, digital transformation for all, climate adaptation, knowledge work, complexity, philosophy of science/tech, change, learning

The areas I am looking to extend my blog reading towards are:

  • Indian bloggers, or India based blogs in English
  • Chinese bloggers, or China based blogs in English
  • EU based bloggers, in Spanish, French, Italian or German languages. Or Spain, France, Italy, or Germany based bloggers in English
  • Middle-, South-American bloggers in Spanish/Portuguese or English
  • Bloggers based in SE-Asia
  • Bloggers based in Nigeria, Kenya, Tanzania, Uganda, South-Africa

Any pointers, or pointers to list- or aggregator sites to explore are appreciated.

I had thought I had the language stuff all sorted, also because I had tested it. As it turns out, Google Translate works slightly different than my earlier conclusion.
It does look at the declared language in the <html> tag, but it doesn’t do so exclusively. Even if the language is declared it seems to still also look at the machine learning model.
This has as an effect that when a posting here in Dutch or German is very short, tweet-like, it will still detect that most of the page is in English (navigation structure, sidebar etc.), and treat the entire page as English. This makes even less sense than my earlier notion it follows the declared language, and machine learning if nothing’s declared, as it seems to actively distrust even the little bit of language mark-up it bothers to check in the first place.

It does mean that adding machine translation links at the end of Dutch and German posting is a good service to provide. Here I can’t trust the auto-detect feature of Google Translate (see above), so I must force the correct source language in the link I provide. This doubles the code needed (once for Dutch, once for German), but it works. The code is in the same function I previously adopted from Frank and Jan. I’ve added the translation links only to the RSS-feed, not to the website. My reasoning is that most of my regular readers do so through RSS, and that it’s them that might be interested in also reading my non-English postings.


A posting in Dutch as it appears on the site


The same posting in Dutch as it appears in the RSS feed, with added link to machine translation

For now I’m done with language adaptations. Although, having looked at some of the older conversations concerning multilingualism I’ve had over the years, I also considered how Stephanie Booth adds English excerpts at the start of a posting in French and vice versa. That might be something to emulate. However, it should not clutter up the postings or feeds too much, so likely should be another field. As I’m already using the excerpt field for other things (posting to Twitter and Mastodon mostly), that’s something to figure out in the future.