Subversion Repositories Sites.tela-botanica.org

Rev

Blame | Last modification | View Log | RSS feed

<?php

/***************************************************************************\
 *  SPIP, Systeme de publication pour l'internet                           *
 *                                                                         *
 *  Copyright (c) 2001-2005                                                *
 *  Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James  *
 *                                                                         *
 *  Ce programme est un logiciel libre distribue sous licence GNU/GPL.     *
 *  Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne.   *
\***************************************************************************/


//
// Ce fichier ne sera execute qu'une fois
if (defined("_ECRIRE_INC_TIDY")) return;
define("_ECRIRE_INC_TIDY", "1");


function version_tidy() {
        static $version = -1;
        if ($version == -1) {
                $version = 0;
                if (function_exists('tidy_parse_string')) {
                        $version = 1;
                        if (function_exists('tidy_get_body')) {
                                $version = 2;
                        }
                }
        }
        return $version;
}


function echappe_xhtml ($letexte) { // oui, c'est dingue... on echappe le mathml
        $regexp_echap_math = "/<(math|textarea)((.*?))<\/$1>/si";
        $source = "xhtml";

        if (preg_match_all($regexp_echap_math, $letexte, $regs, PREG_SET_ORDER))
        foreach ($regs as $reg) {
                $num_echap++;
                $les_echap[$num_echap] = $reg[0];
                $letexte = str_replace($reg[0],"@@SPIP_$source$num_echap@@", $letexte);
        }

        return array($letexte, $les_echap);
}


function xhtml($buffer) {
        $buffer = traite_xhtml($buffer);

/** ici commence la petite usine a gaz des traitements d'erreurs de tidy **/
        ## NB: seul tidy en ligne de commande sait gerer ses erreurs,

        // Conserver une liste des URLs en erreur tidy
        lire_fichier($f = _DIR_SESSIONS.'w3c-go-home.txt', $liste);
        $url = "http://".$_SERVER['HTTP_HOST'].nettoyer_uri();

        if (defined('_erreur_tidy')) {

                if (defined('_calcul_tidy')) {
                        spip_log("Erreur tidy : $url\n"._erreur_tidy, 'tidy');
                        if (strpos($liste, "- $url -\n") === false) {
                                $liste = substr($liste, - 8*1024); # anti-explosions
                                ecrire_fichier($f, $liste."- $url -\n");
                        }
                }

                $GLOBALS['xhtml_error'] = _erreur_tidy;

                // Na, na na nere, tidy a plante !
                header("X-SPIP-Message: tidy/W3C could not repair this page");

        }
        else # pas d'erreur
        {
                // Nettoyer la liste des URLs pourries, si maintenant on est correct
                if (defined('_calcul_tidy')) {
                        if (($liste2 = str_replace("- $url -\n", '', $liste)) != $liste)
                                ecrire_fichier($f, $liste2);
                }

                // Faire la pub parce qu'on est content
                header("X-SPIP-Message: tidy/W3C has verified this page");

# tres perilleux, et totalement inutile a ce stade (mais fonctionnel si on veut)
#               if (defined('_TIDY_COMMAND'))
#                       entetes_xhtml();

        }
        // Ajouter un bouton d'admin "Analyser"
        $GLOBALS['xhtml_check'] = 'http://validator.w3.org/check?uri='
                . urlencode("http://" . $_SERVER['HTTP_HOST'] . nettoyer_uri());
/** fin de l'usine a gaz **/


        return $buffer;
}

function traite_xhtml ($buffer) {

        // Seuls les charsets iso-latin et utf-8 sont concernes
        $charset = lire_meta('charset');
        if ($charset == "iso-8859-1")
                $enc_char = "latin1";
        else if ($charset == "utf-8")
                $enc_char = "utf8";
        else {
                spip_log("erreur inc_tidy : charset=$charset", 'tidy');
                return $buffer;
        }

        if (defined('_TIDY_COMMAND')) {
                // Si l'on a defini un chemin pour tidyHTML 
                // en ligne de commande 
                // (pour les sites qui n'ont pas tidyPHP)

                list($buffer, $les_echap) = echappe_xhtml($buffer); # math et textarea

                $cache = _DIR_CACHE.creer_repertoire(_DIR_CACHE,'tidy');
                $nomfich = $cache.'tidy'.md5($buffer);
                if (!file_exists($nomfich)) {
                        define ('_calcul_tidy', 1);
                        $tmp = "$nomfich.".@getmypid().".tmp";
                        ecrire_fichier($tmp, $buffer, true); # ecrire meme en mode preview

                        // Experimental : on peut definir ses propres options tidy
                        if (!defined('_TIDY_OPTIONS'))
                                $options = "--output-xhtml true";   # a.k.a. -asxhtml
                        else
                                $options = _TIDY_OPTIONS;

                        $c = _TIDY_COMMAND
                                ." --tidy-mark false"
                                ." --quote-nbsp false"
                                ." --show-body-only false"
                                ." --indent true"
                                ." --wrap false"
                                ." --add-xml-decl false"
                                ." --char-encoding $enc_char"
                                ." ".$options
                                ." -m $tmp"
                                ." 2>&1";
                        spip_log(nettoyer_uri(), 'tidy');
                        spip_timer('tidy');
                        exec($c, $verbose, $exit_code);
                        spip_log ($c.' ('.spip_timer('tidy').')', 'tidy');
                        if ($exit_code == 2) {
                                define ('_erreur_tidy', join("\n", $verbose));
                                # un fichier .err accompagne le cache, qu'on s'en souvienne
                                # au prochain hit (gestion d'erreur)
                                spip_touch("$nomfich.err");
                        } else {
                                @unlink("$nomfich.err");
                        }

                        rename($tmp,$nomfich);
                }

                if (lire_fichier($nomfich, $tidy)
                AND strlen(trim($tidy)) > 0) {
                        // purger le petit cache toutes les 5 minutes (300s)
                        spip_touch($nomfich); # rester vivant
                        if (spip_touch($cache.'purger_tidy', 300, true)) {
                                if ($h = @opendir($cache)) {
                                        while (($f = readdir($h)) !== false) {
                                                if (preg_match(',^tidy[^.]*$,', $f)
                                                AND time() - filemtime("$cache$f") > 300) {
                                                        @unlink("$cache$f");
                                                        @unlink("$cache$f.err");
                                                }
                                        }
                                }
                        }

                        $tidy = preg_replace (",<[?]xml.*>,U", "", $tidy);
                        if (@file_exists("$nomfich.err")) {
                                define ('_erreur_tidy', 1);
                        }
                        return $tidy;
                } else {
                        define ('_erreur_tidy', 1);
                        return $buffer;
                }
        }

        ### tout ce qui suit est non teste, et probablement non fonctionnel
        else if (version_tidy() == "1") {
                include_ecrire("inc_texte.php3");

                list($buffer, $les_echap) = echappe_xhtml($buffer); # math et textarea

                tidy_set_encoding ($enc_char);
                tidy_setopt('wrap', 0);
                tidy_setopt('indent-spaces', 4);
                tidy_setopt('output-xhtml', true);
                tidy_setopt('add-xml-decl', false);
                tidy_setopt('indent', 5);
                tidy_setopt('show-body-only', false);
                tidy_setopt('quote-nbsp', false);

                tidy_parse_string($buffer);
                tidy_clean_repair();
                $tidy = tidy_get_output();

                if ($les_echap) {
                        include_ecrire("inc_texte.php3");
                        $tidy = echappe_retour($tidy, $les_echap, "xhtml");
                }

                // En Latin1, tidy ajoute une declaration XML
                // (malgre add-xml-decl a false) ; il faut le supprimer
                // pour eviter interpretation PHP provoquant une erreur
                $tidy = ereg_replace ("\<\?xml([^\>]*)\>", "", $tidy);
                # pas de gestion d'erreur ?
                return $tidy;
        }
        else if (version_tidy() == "2") {
                include_ecrire("inc_texte.php3");
        
                list($buffer, $les_echap) = echappe_xhtml($buffer); # math et textarea

                $config = array(
                        'wrap' => 0,
                        'indent-spaces' => 4,
                        'output-xhtml' => true,
                        'add-xml-decl' => false,
                        'indent' => 0,
                        'show-body-only' => false,
                        'quote-nbsp' => false
                        );
                $tidy = tidy_parse_string($buffer, $config, $enc_char);
                tidy_clean_repair($tidy);

                if ($les_echap) {
                        include_ecrire("inc_texte.php3");
                        $tidy = echappe_retour($tidy, $les_echap, "xhtml");
                }

                $tidy = ereg_replace ("\<\?xml([^\>]*)\>", "", $tidy);
                # pas de gestion d'erreur ?
                return $tidy;
        }
        else {
                define ('_erreur_tidy', 1);
                return $buffer;
        }
}

## desactive pour le moment... complications dans tous les sens et gros risque d'erreur
function entetes_xhtml() {
        // Si Mozilla et tidy actif, passer en "application/xhtml+xml"
        // extremement risque: Mozilla passe en mode debugueur strict
        // mais permet d'afficher du MathML directement dans le texte
        // (et sauf erreur, c'est la bonne facon de declarer du xhtml)
        if (strpos($_SERVER['HTTP_ACCEPT'], "application/xhtml+xml")) {
                @header("Content-Type: application/xhtml+xml; charset=".lire_meta('charset'));
        } else {
                @header("Content-Type: text/html; charset=".lire_meta('charset'));
                echo '<'.'?xml version="1.0" encoding="'. lire_meta('charset').'"?'.">\n";
        }
}

?>