Rev 4 | Go to most recent revision | Blame | Compare with Previous | Last modification | View Log | RSS feed
<?php
/***************************************************************************\
* SPIP, Systeme de publication pour l'internet *
* *
* Copyright (c) 2001-2005 *
* Arnaud Martin, Antoine Pitrou, Philippe Riviere, Emmanuel Saint-James *
* *
* Ce programme est un logiciel libre distribue sous licence GNU/GPL. *
* Pour plus de details voir le fichier COPYING.txt ou l'aide en ligne. *
\***************************************************************************/
// Ce fichier ne sera execute qu'une fois
if (defined("_INC_HTML_SQUEL")) return;
define("_INC_HTML_SQUEL", "1");
# Ce fichier doit IMPERATIVEMENT contenir la fonction "phraser"
# qui transforme un squelette en un tableau d'objets de classe Boucle
# il est charge par un include calcule dans inc-calcul-squel
# pour permettre differentes syntaxes en entree
define('BALISE_BOUCLE', '<BOUCLE');
define('BALISE_FIN_BOUCLE', '</BOUCLE');
define('BALISE_PRE_BOUCLE', '<B');
define('BALISE_POST_BOUCLE', '</B');
define('BALISE_ALT_BOUCLE', '<//B');
define('TYPE_RECURSIF', 'boucle');
define('SPEC_BOUCLE','[[:space:]]*\(([^)]*)\)');
define('NOM_DE_BOUCLE', "[0-9]+|[-_][-_.a-zA-Z0-9]*");
# ecriture alambiquee pour rester compatible avec les hexadecimaux des vieux squelettes
define('NOM_DE_CHAMP', "#((" . NOM_DE_BOUCLE . "):)?(([A-F]*[G-Z_][A-Z_0-9]*)|[A-Z_]+)(\*?)");
define('CHAMP_ETENDU', '\[([^]\[]*)\(' . NOM_DE_CHAMP . '([^[)]*\)[^]\[]*)\]');
define('BALISE_INCLURE','<INCLU[DR]E[[:space:]]*\(([^)]*)\)');
function phraser_inclure($texte, $ligne, $result) {
while (ereg(BALISE_INCLURE, $texte, $match)) {
$p = strpos($texte,$match[0]);
$debut = substr($texte, 0, $p);
if ($p) $result = phraser_idiomes($debut, $ligne, $result);
$ligne += substr_count($debut, "\n");
$champ = new Inclure;
$champ->ligne = $ligne;
$ligne += substr_count($match[0], "\n");
$champ->texte = $match[1];
$texte = substr($texte, $p+strlen($match[0]));
// on assimile {var=val} a une liste de un argument sans fonction
phraser_args($texte,">","",$result,$champ);
foreach ($champ->param as $k => $v) {
$var = $v[1][0];
if ($var->type != 'texte')
erreur_squelette(_T('zbug_parametres_inclus_incorrects'),
$match[0]);
else {
ereg("^([^=]*)(=)?(.*)$", $var->texte,$m);
if ($m[2]) {
$champ->param[$k][0] = $m[1];
$val = $m[3];
if (ereg('^[\'"](.*)[\'"]$', $val, $m)) $val = $m[1];
$champ->param[$k][1][0]->texte = $val;
}
else
$champ->param[$k] = array($m[1]);
}
}
$texte = substr($champ->apres,1);
$champ->apres = "";
$result[] = $champ;
}
return (($texte==="") ? $result : phraser_idiomes($texte, $ligne, $result));
}
function phraser_polyglotte($texte,$ligne, $result) {
while (eregi('<multi>([^<]*)</multi>', $texte, $match)) {
$p = strpos($texte, $match[0]);
$debut = substr($texte, 0, $p);
if ($p) {
$champ = new Texte;
$champ->texte = $debut;
$champ->ligne = $ligne;
$result[] = $champ;
}
$champ = new Polyglotte;
$ligne += substr_count($champ->texte, "\n");
$champ->ligne = $ligne;
$ligne += substr_count($match[0], "\n");
$lang = '';
$bloc = $match[1];
$texte = substr($texte,$p+strlen($match[0]));
while (preg_match("/^[[:space:]]*([^[{]*)[[:space:]]*[[{]([a-z_]+)[]}](.*)$/si", $bloc, $regs)) {
$trad = $regs[1];
if ($trad OR $lang)
$champ->traductions[$lang] = $trad;
$lang = $regs[2];
$bloc = $regs[3];
}
$champ->traductions[$lang] = $bloc;
$result[] = $champ;
}
if ($texte!=="") {
$champ = new Texte;
$champ->texte = $texte;
$champ->ligne = $ligne;
$result[] = $champ;
}
return $result;
}
function phraser_idiomes($texte,$ligne,$result) {
// Reperer les balises de traduction <:toto:>
while (eregi("<:(([a-z0-9_]+):)?([a-z0-9_]+)((\|[^:>]*)?:>)", $texte, $match)) {
$p = strpos($texte, $match[0]);
$debut = substr($texte, 0, $p);
if ($p) $result = phraser_champs($debut, $ligne, $result);
$champ = new Idiome;
$ligne += substr_count($debut, "\n");
$champ->ligne = $ligne;
$ligne += substr_count($match[0], "\n");
$texte = substr($texte,$p+strlen($match[0]));
$champ->nom_champ = strtolower($match[3]);
$champ->module = $match[2] ? $match[2] : 'public/spip/ecrire';
// pas d'imbrication pour les filtres sur langue
phraser_args($match[5], ":", '', array(), $champ);
$result[] = $champ;
}
if ($texte!=="") $result = phraser_champs($texte,$ligne,$result);
return $result;
}
function phraser_champs($texte,$ligne,$result) {
while (ereg(NOM_DE_CHAMP, $texte, $match)) {
$p = strpos($texte, $match[0]);
$suite = substr($texte,$p+strlen($match[0]));
if ($match[5] || (strpos($suite[0], "[0-9]") === false)) {
$debut = substr($texte, 0, $p);
if ($p) $result = phraser_polyglotte($debut, $ligne, $result);
$ligne += substr_count($debut, "\n");
$champ = new Champ;
$champ->ligne = $ligne;
$ligne += substr_count($match[0], "\n");
$champ->nom_boucle = $match[2];
$champ->nom_champ = $match[3];
$champ->etoile = $match[5];
$texte = $suite;
$result[] = $champ;
} else {
// faux champ
$result = phraser_polyglotte (substr($texte, 0, $p+1), $ligne, $result);
$texte = (substr($texte, $p+1));
}
}
if ($texte!=="") $result = phraser_polyglotte($texte, $ligne, $result);
return $result;
}
// Gestion des imbrications:
// on cherche les [..] les plus internes et on les remplace par une chaine
// %###N@ ou N indexe un tableau comportant le resultat de leur analyse
// on recommence tant qu'il y a des [...] en substituant a l'appel suivant
function phraser_champs_etendus($texte, $ligne,$result) {
if ($texte==="") return $result;
$sep = '##';
while (strpos($texte,$sep)!== false)
$sep .= '#';
return array_merge($result, phraser_champs_interieurs($texte, $ligne, $sep, array()));
}
// Analyse les filtres d'un champ etendu et affecte le resultat
// renvoie la liste des lexemes d'origine augmentee
// de ceux trouves dans les arguments des filtres (rare)
// sert aussi aux arguments des includes et aux criteres de boucles
// Tres chevelu
function phraser_args($texte, $fin, $sep, $result, &$pointeur_champ) {
$texte = ltrim($texte);
while (($texte!=="") && strpos($fin, $texte[0]) === false) {
preg_match(",^(\|?[^{)|]*)(.*)$,ms", $texte, $match);
$suite = ltrim($match[2]);
$fonc = trim($match[1]);
if ($fonc[0] == "|") $fonc = ltrim(substr($fonc,1));
$res = array($fonc);
$args = $suite ;
// cas du filtre sans argument ou du critere /
if (($suite[0] != '{') || ($fonc && $fonc[0] == '/'))
{
// si pas d'argument, alors il faut une fonction ou un double |
if (!$match[1])
erreur_squelette(_T('zbug_info_erreur_squelette'), $texte);
// pas d'arg et pas d'autres filtres ==> critere infixe comme "/"
if (($fin != ':') &&
((!$suite) || strpos(")|", $suite[0]) === false)) break;
} else {
$args = ltrim(substr($suite,1));
$collecte = array();
while ($args && $args[0] != '}') {
if ($args[0] == '"')
preg_match ('/^(")([^"]*)(")(.*)$/ms', $args, $regs);
else if ($args[0] == "'")
preg_match ("/^(')([^']*)(')(.*)$/ms", $args, $regs);
else {
preg_match("/^([[:space:]]*)([^,([{}]*([(\[{][^])}]*[])}])?[^$fin,}]*)([,}$fin].*)$/ms", $args, $regs);
if (!strlen($regs[2]))
{
erreur_squelette(_T('zbug_info_erreur_squelette'), $args);
$args = '';
exit;
}
}
$arg = $regs[2];
if (trim($regs[1])) {
$champ = new Texte;
$champ->texte = $arg;
$champ->apres = $champ->avant = $regs[1];
$result[] = $champ;
$collecte[] = $champ;
$args = ltrim($regs[count($regs)-1]);
} else {
if (!ereg(NOM_DE_CHAMP ."[{|]", $arg, $r)) {
// 0 est un aveu d'impuissance. A completer
$arg = phraser_champs_exterieurs($arg, 0, $sep, $result);
$args = ltrim($regs[count($regs)-1]);
$collecte = array_merge($collecte, $arg);
$result = array_merge($result, $arg);
}
else {
$n = strpos($args,$r[0]);
$pred = substr($args, 0, $n);
$par = ',}';
if (ereg('^(.*)\($', $pred, $m))
{$pred = $m[1]; $par =')';}
if ($pred) {
$champ = new Texte;
$champ->texte = $pred;
$champ->apres = $champ->avant = "";
$result[] = $champ;
$collecte[] = $champ;
}
$rec = substr($args, $n + strlen($r[0]) -1);
$champ = new Champ;
$champ->nom_boucle = $r[2];
$champ->nom_champ = $r[3];
$champ->etoile = $r[5];
phraser_args($rec, $par, $sep, array(), $champ);
$args = $champ->apres ;
$champ->apres = '';
if ($par==')') $args = substr($args,1);
$collecte[] = $champ;
$result[] = $champ;
}
}
if ($args[0] == ',') {
$args = ltrim(substr($args,1));
if ($collecte)
{$res[] = $collecte; $collecte = array();}
}
}
if ($collecte) {$res[] = $collecte; $collecte = array();}
$args = substr($args,1);
}
$n = strlen($suite) - strlen($args);
$pointeur_champ->param[] = $res;
// pour les balises avec faux filtres qui boudent ce dur larbeur
$pointeur_champ->fonctions[] = array($fonc, substr($suite, 0, $n));
$texte = ltrim($args);
}
# laisser l'appelant virer le caractere fermant
$pointeur_champ->apres = $texte;
return $result;
}
function phraser_champs_exterieurs($texte, $ligne, $sep, $nested) {
$res = array();
while (($p=strpos($texte, "%$sep"))!==false) {
$debut = substr($texte,0,$p);
if ($p) $res = phraser_inclure($debut, $ligne, $res);
$ligne += substr_count($debut, "\n");
ereg("^%$sep([0-9]+)@(.*)$", substr($texte,$p),$m);
$res[]= $nested[$m[1]];
$texte = $m[2];
}
return (($texte==="") ? $res : phraser_inclure($texte, $ligne, $res));
}
function phraser_champs_interieurs($texte, $ligne, $sep, $result) {
$i = 0; // en fait count($result)
$x = "";
while (true) { $j=$i; $n = $ligne;
while (ereg(CHAMP_ETENDU, $texte, $match)) {
$p = strpos($texte, $match[0]);
$debut = substr($texte, 0, $p);
if ($p) {$result[$i] = $debut;$i++; }
$champ = new Champ;
// ca ne marche pas encore en cas de champ imbrique
$champ->ligne = $x ? 0 :($n+substr_count($debut, "\n"));
$champ->nom_boucle = $match[3];
$champ->nom_champ = $match[4];
$champ->etoile = $match[6];
// phraser_args indiquera ou commence apres
$result = phraser_args($match[7], ")", $sep, $result, $champ);
$champ->avant = phraser_champs_exterieurs($match[1],$n,$sep,$result);
$debut = substr($champ->apres,1);
$n += substr_count(substr($texte, 0, strpos($texte, $debut)), "\n");
$champ->apres = phraser_champs_exterieurs($debut,$n,$sep,$result);
$result[$i] = $champ;
$i++;
$texte = substr($texte,$p+strlen($match[0]));
}
if ($texte!=="") {$result[$i] = $texte; $i++;}
$x ='';
while($j < $i)
{ $z= $result[$j];
// j'aurais besoin de connaitre le nombre de lignes...
if (is_object($z)) $x .= "%$sep$j@" ; else $x.=$z ;
$j++;}
if (ereg(CHAMP_ETENDU, $x)) $texte = $x;
else return phraser_champs_exterieurs($x, $ligne, $sep, $result);}
}
// analyse des criteres de boucle,
function phraser_criteres($params, &$result) {
$args = array();
$type = $result->type_requete;
foreach($params as $v) {
$var = $v[1][0];
$param = ($var->type != 'texte') ? "" : $var->texte;
if ((count($v) > 2) && (!eregi("[^A-Za-z]IN[^A-Za-z]",$param)))
{
// plus d'un argument et pas le critere IN:
// detecter comme on peut si c'est le critere implicite LIMIT debut, fin
if (($var->type != 'texte') ||
(strpos("0123456789-", $param[strlen($param)-1])
!== false)) {
$op = ',';
$not = "";
} else {
preg_match("/^([!]?)([a-zA-Z][a-zA-Z0-9]*)[[:space:]]*(.*)$/ms", $param, $m);
$op = $m[2];
$not = $m[1];
if ($m[3]) $v[1][0]->texte = $m[3]; else array_shift($v[1]);
}
array_shift($v);
$crit = new Critere;
$crit->op = $op;
$crit->not = $not;
$crit->param = $v;
$args[] = $crit;
} else {
if ($var->type != 'texte') {
// cas 1 seul arg ne commencant pas par du texte brut:
// erreur ou critere infixe "/"
if (($v[1][1]->type != 'texte') || (trim($v[1][1]->texte) !='/'))
erreur_squelette('criteres',$var->nom_champ);
else {
$crit = new Critere;
$crit->op = '/';
$crit->not = "";
$crit->param = array(array($v[1][0]),array($v[1][2]));
$args[] = $crit;
}
} else {
// traiter qq lexemes particuliers pour faciliter la suite
// les separateurs
if ($var->apres)
$result->separateur[] = $param;
elseif (($param == 'tout') OR ($param == 'tous'))
$result->tout = true;
elseif ($param == 'plat')
$result->plat = true;
// Boucle hierarchie, analyser le critere id_article - id_rubrique
// - id_syndic, afin, dans les cas autres que {id_rubrique}, de
// forcer {tout} pour avoir la rubrique mere...
elseif (($type == 'hierarchie') &&
($param == 'id_article' OR $param == 'id_syndic'))
$result->tout = true;
elseif (($type == 'hierarchie') && ($param == 'id_rubrique'))
{;}
else {
// pas d'emplacement statique, faut un dynamique
/// mais il y a 2 cas qui ont les 2 !
if (($param == 'unique') || (ereg('^!?doublons *', $param)))
{
// cette variable sera inseree dans le code
// et son nom sert d'indicateur des maintenant
$result->doublons = '$doublons_index';
if ($param == 'unique') $param = 'doublons';
}
elseif ($param == 'recherche')
// meme chose (a cause de #nom_de_boucle:URL_*)
$result->hash = true;
if (ereg('^ *([0-9-]+) *(/) *(.+) *$', $param, $m)) {
$crit = phraser_critere_infixe($m[1], $m[3],$v, '/', '', '');
} elseif (ereg('^(`?[A-Za-z_][A-Za-z_0-9]*\(?[A-Za-z_]*\)?`?)[[:space:]]*(\??)(!?)(<=?|>=?|==?|IN)[[:space:]]*"?([^<>=!"]*)"?$', $param, $m)) {
$crit = phraser_critere_infixe($m[1], $m[5],$v,
(($m[1] == 'lang_select') ? $m[1] : trim($m[4])),
$m[3], $m[2]);
} elseif (preg_match("/^([!]?)[[:space:]]*([A-Za-z_][A-Za-z_0-9]*)[[:space:]]*(\??)(.*)$/ism", $param, $m)) {
// contient aussi les comparaisons implicites !
array_shift($v);
if ($m[4])
$v[0][0]->texte = $m[4];
else {
array_shift($v[0]);
if (!$v[0]) array_shift($v);
}
$crit = new Critere;
$crit->op = $m[2];
$crit->param = $v;
$crit->not = $m[1];
$crit->cond = $m[3];
}
else {
erreur_squelette(_T('zbug_critere_inconnu',
array('critere' => $param)));
}
$args[] = $crit;
}
}
}
}
$result->criteres = $args;
}
function phraser_critere_infixe($arg1, $arg2, $args, $op, $not, $cond)
{
$args[0] = new Texte;
$args[0]->texte = $arg1;
$args[0] = array($args[0]);
$args[1][0]->texte = $arg2;
$crit = new Critere;
$crit->op = $op;
$crit->not = $not;
$crit->cond = $cond;
$crit->param = $args;
return $crit;
}
function phraser($texte, $id_parent, &$boucles, $nom, $ligne=1) {
$all_res = array();
while (($p = strpos($texte, BALISE_BOUCLE)) !== false) {
$result = new Boucle;
$result->id_parent = $id_parent;
# attention: reperer la premiere des 2 balises: pre_boucle ou boucle
$n = ereg(BALISE_PRE_BOUCLE . '[0-9_]', $texte, $r);
if ($n) $n = strpos($texte, $r[0]);
if (($n === false) || ($n > $p)) {
$debut = substr($texte, 0, $p);
$milieu = substr($texte, $p);
$k = strpos($milieu, '(');
$id_boucle = trim(substr($milieu,
strlen(BALISE_BOUCLE),
$k - strlen(BALISE_BOUCLE)));
$milieu = substr($milieu, $k);
/* a adapter: si $n pointe sur $id_boucle ...
if (strpos($milieu, $s)) {
erreur_squelette(_T('zbug_erreur_boucle_syntaxe'),
$id_boucle .
_T('zbug_balise_b_aval'));
}
*/
} else {
$debut = substr($texte, 0, $n);
$milieu = substr($texte, $n);
$k = strpos($milieu, '>');
$id_boucle = substr($milieu,
strlen(BALISE_PRE_BOUCLE),
$k - strlen(BALISE_PRE_BOUCLE));
if (!ereg(BALISE_BOUCLE . $id_boucle . "[[:space:]]*\(", $milieu, $r))
erreur_squelette((_T('zbug_erreur_boucle_syntaxe')), $id_boucle);
$p = strpos($milieu, $r[0]);
$result->avant = substr($milieu, $k+1, $p-$k-1);
$milieu = substr($milieu, $p+strlen($id_boucle)+strlen(BALISE_BOUCLE));
}
$result->id_boucle = $id_boucle;
ereg(SPEC_BOUCLE, $milieu, $match);
$milieu = substr($milieu, strlen($match[0]));
$type = $match[1];
if ($p = strpos($type, ':'))
{
$result->sql_serveur = substr($type,0,$p);
$soustype = strtolower(substr($type,$p+1));
}
else
$soustype = strtolower($type);
if ($soustype == 'sites') $soustype = 'syndication' ; # alias
//
// analyser les criteres et distinguer la boucle recursive
//
if (substr($soustype, 0, 6) == TYPE_RECURSIF) {
$result->type_requete = TYPE_RECURSIF;
$result->param[0] = substr($type, strlen(TYPE_RECURSIF));
$milieu = substr($milieu, strpos($milieu, '>')+1);
$params = "";
} else {
$result->type_requete = $soustype;
phraser_args($milieu,">","",$all_res,$result);
$params = substr($milieu,0,strpos($milieu,$result->apres));
$milieu = substr($result->apres,1);
$result->apres = "";
phraser_criteres($result->param, $result);
}
//
// Recuperer la fin :
//
$s = BALISE_FIN_BOUCLE . $id_boucle . ">";
$p = strpos($milieu, $s);
if ($p === false) {
erreur_squelette(_T('zbug_erreur_boucle_syntaxe'),
_T('zbug_erreur_boucle_fermant',
array('id'=>$id_boucle)));
}
$suite = substr($milieu, $p + strlen($s));
$milieu = substr($milieu, 0, $p);
//
// 1. Recuperer la partie conditionnelle apres
//
$s = BALISE_POST_BOUCLE . $id_boucle . ">";
$p = strpos($suite, $s);
if ($p !== false) {
$result->apres = substr($suite, 0, $p);
$suite = substr($suite, $p + strlen($s));
}
//
// 2. Recuperer la partie alternative
//
$s = BALISE_ALT_BOUCLE . $id_boucle . ">";
$p = strpos($suite, $s);
if ($p !== false) {
$result->altern = substr($suite, 0, $p);
$suite = substr($suite, $p + strlen($s));
}
$result->ligne = $ligne + substr_count($debut, "\n");
$m = substr_count($milieu, "\n");
$b = substr_count($result->avant, "\n");
$a = substr_count($result->apres, "\n");
// envoyer la boucle au debugueur
if ($GLOBALS['var_mode']== 'debug') {
boucle_debug ($nom, $id_parent, $id_boucle,
$type,
$params,
$result->avant,
$milieu,
$result->apres,
$result->altern);
}
$result->avant = phraser($result->avant, $id_parent,$boucles, $nom, $result->ligne);
$result->apres = phraser($result->apres, $id_parent,$boucles, $nom, $result->ligne+$b+$m);
$result->altern = phraser($result->altern,$id_parent,$boucles, $nom, $result->ligne+$a+$m+$b);
$result->milieu = phraser($milieu, $id_boucle,$boucles, $nom, $result->ligne+$b);
if ($boucles[$id_boucle]) {
erreur_squelette(_T('zbug_erreur_boucle_syntaxe'),
_T('zbug_erreur_boucle_double',
array('id'=>$id_boucle)));
} else
$boucles[$id_boucle] = $result;
$all_res = phraser_champs_etendus($debut, $ligne, $all_res);
$all_res[] = $result;
$ligne += substr_count(substr($texte, 0, strpos($texte, $suite)), "\n");
$texte = $suite;
}
return phraser_champs_etendus($texte, $ligne, $all_res);
}
?>