XHTML5 oder HTML5

Zuerst sollte man sich Klarheit darüber verschaffen zu welcher Möglichkeit man bei der Umsetzung überhaupt in der Lage ist.
Um XHTML5 einsetzen zu können muss man in der Lage sein den http Request-Header zu analysieren und je nach Möglichkeit des Browsers den Response-Header und den Aufbau der Seite zu beeinflussen!

Die Auswertung des Headers könnte wie folgt aussehen (PHP):

$xhtml5 = (isset($_SERVER['HTTP_ACCEPT']) &&
  strpos($_SERVER['HTTP_ACCEPT'], 'application/xhtml+xml')!==false);
if ($xhtml5) {
  header('Content-Type: application/xhtml+xml; charset=UTF-8');
  echo '<?xml version="1.0" encoding="UTF-8"?>';
} else {
  header('Content-Type: text/html; charset=UTF-8');
}

Der Doctype definiert den Typ des Dokumentes, im Gegensatz zu den vorherigen HTML Versionen verweist der HTML5 Doctype nicht mehr auf eine DTD.
Da in Zukunft die Entwicklung von Browsern nicht mehr wie bisher auf einen SGML-Parser basieren soll der ein DTD anwendet, sondern als eigenständige Entwicklung die auch nicht in HTML5 deklarierte Elemente aus vorherigen HTML-Versionen richtig darstellen soll.

<!DOCTYPE html>

PHP:

echo '<!DOCTYPE html>';

Das html Tag unter XHTML benötigt die Angabe des Namespaces.

XHTML:

<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="de" lang="de">

oder HTML:

<html lang="de">

PHP:

$lang = 'de'; //Sprache
$manifest = 'home.appcache'; //URL zum Mainfest (offline Mode)
echo '<html ' . ($xhtml5 ? 'xmlns="http://www.w3.org/1999/xhtml" xml:lang="' . $lang . '"' : '') .
  (!isset($manifest) ? ' manifest="' . $manifest . '"' : '') . ' lang="' . $lang . '">';

XHTML5 kennt nur die folgenden 5 Entities: &, <, >, " und '

Also gibt es nur die Möglichkeit alle Entities durch Zeichen in der richtigen Codierung zu ersetzen.
Dabei kann die folgende Datei helfen: www.w3.org/TR/html5-author/entities.json

Allgemein (X)HTML5

Der head Bereich unterscheidet sich gegenüber den vorherigen HTML/XHTML Versionen durch die folgenden Metatag-Angaben:

alt:

<meta http-equiv="content-type" content="text/html; charset=UTF-8" />

neu:

<meta charset="UTF-8" />

entfällt:

<meta http-equiv="content-language" content="de" />