New file |
0,0 → 1,251 |
<?php |
/*vim: set expandtab tabstop=4 shiftwidth=4: */ |
// +------------------------------------------------------------------------------------------------------+ |
// | PHP version 4.1 | |
// +------------------------------------------------------------------------------------------------------+ |
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org) | |
// +------------------------------------------------------------------------------------------------------+ |
// | This file is part of Papyrus. | |
// | | |
// | Foobar is free software; you can redistribute it and/or modify | |
// | it under the terms of the GNU General Public License as published by | |
// | the Free Software Foundation; either version 2 of the License, or | |
// | (at your option) any later version. | |
// | | |
// | Foobar is distributed in the hope that it will be useful, | |
// | but WITHOUT ANY WARRANTY; without even the implied warranty of | |
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the | |
// | GNU General Public License for more details. | |
// | | |
// | You should have received a copy of the GNU General Public License | |
// | along with Foobar; if not, write to the Free Software | |
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA | |
// +------------------------------------------------------------------------------------------------------+ |
// CVS : $Id$ |
/** |
* Classe permettant d'effectuer des recherches sur les informations des articles de Spip. |
* |
* Permet de rechercher et classer les articles en fonction d'une chaine. |
* Utilisation des bibliothèques inclue par Papyrus : |
* - Papyrus pap_meta.fonct.php |
* - Papyrus pap_menu.fonct.php |
* - Papyrus pap_url.class.php |
* |
*@package Applette |
*@subpackage Moteur_Recherche |
//Auteur original : |
*@author Jean-Pascal MILCENT <jpm@tela-botanica.org> |
//Autres auteurs : |
*@author aucun |
*@copyright Tela-Botanica 2000-2006 |
*@version $Revision$ $Date$ |
// +------------------------------------------------------------------------------------------------------+ |
*/ |
|
// +------------------------------------------------------------------------------------------------------+ |
// | ENTETE du PROGRAMME | |
// +------------------------------------------------------------------------------------------------------+ |
///** Inclusion du fichier contenant les fonctions de manipulations des menus de Papyrus.*/ |
//require_once GEN_CHEMIN_BIBLIO.'pap_menu.fonct.php'; |
|
// +------------------------------------------------------------------------------------------------------+ |
// | CORPS du PROGRAMME | |
// +------------------------------------------------------------------------------------------------------+ |
|
class Recherche_Spip_Article extends Recherche { |
|
// Constructeur |
function Recherche_Menu_Meta($motif) { |
$this->setMotif($motif); |
} |
|
// Accesseurs |
function getMotif() { |
return $this->motif; |
} |
function setMotif($motif) { |
$this->motif = $motif; |
} |
|
// Méthodes |
function rechercherMotif($motif) { |
for ($i = 0; $i < count($GLOBALS['_MOTEUR_RECHERCHE_']['spip']); $i++ ) { |
$db = DB::connect($GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['bdd_dsn']); |
if (DB::isError($db)) { |
$msg_erreur_connection = 'Impossible de se connecter à la base de données Spip.'; |
die(BOG_afficherErreurSql(__FILE__, __LINE__, $db->getMessage(), 'connexion à la base de données',$msg_erreur_connection)); |
} |
$prefixe = $GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['table_prefixe']; |
$url_base = $GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['url']; |
$tab_articles = $this->retournerArticles($db, $prefixe); |
foreach ($tab_articles as $article_id => $Article) { |
// Initialisation du tableau de résultat vide |
$aso_resultat = array( 'poids' => 0, 'url' => '', 'titre' => '', |
'hreflang' => '', 'accesskey' => '', 'title' => '', |
'date_creation' => '', 'description' => ''); |
|
// Création de l'url |
$var_recherche = str_replace(' ', '+', trim($motif)); |
$aso_resultat['url'] = $url_base.'article'.$article_id.'.html?var_recherche='.$var_recherche; |
|
// Récupération du titre de la page |
if (trim($Article->titre) != '') { |
$aso_resultat['titre'] = htmlentities($Article->titre); |
} else if (trim($Article->surtitre) != '') { |
$aso_resultat['titre'] = htmlentities($Article->surtitre); |
} else if (trim($Article->soustitre) != '') { |
$aso_resultat['titre'] = htmlentities($Article->soustitre); |
} |
$aso_resultat['hreflang'] = htmlentities($Article->lang); |
|
$aso_resultat['description'] = $this->couper($Article->texte, 450); |
|
if (($jour = date('d', strtotime($Article->date)) ) != 0 ) { |
$aso_resultat['date_creation'] .= '<span class="page_modification_jour"> '.$jour.'</span>'."\n"; |
} |
if (($mois = $this->traduireMois(date('m', strtotime($Article->date))) ) != '' ) { |
$aso_resultat['date_creation'] .= '<span class="page_modification_mois"> '.$mois.'</span>'."\n"; |
} |
if (($annee = date('Y', strtotime($Article->date)) ) != 0 ) { |
$aso_resultat['date_creation'] .= '<span class="page_modification_annee"> '.$annee.'</span>'."\n"; |
} |
|
// Analyse du poids de cette page vis à vis des données |
$tab_champs_a_visiter = array( 'surtitre', 'titre', 'soustitre', 'descriptif', 'chapo', 'texte', 'ps'); |
foreach ($tab_champs_a_visiter as $val) { |
$aso_resultat['poids'] += $this->retournerOccurenceMotif($motif, $Article->$val); |
} |
|
if ($aso_resultat['poids'] > 0) { |
$this->setResultat($aso_resultat); |
} |
} |
} |
return $this->getResultats(); |
} |
|
/** Renvoie un tableau contenant les infos sur les articles |
* |
* @param mixed une instance de la classse Pear DB. |
* @param string le préfixe pour les tables spip. |
* @return array tableau contenant les articles. |
*/ |
function retournerArticles(&$db, $prefixe = '') |
{ |
//---------------------------------------------------------------------------- |
// Recherche des informations sur le menu |
$requete = 'SELECT * '. |
'FROM '.$prefixe.'spip_articles '. |
'WHERE statut = "publie"'; |
|
$resultat = $db->query($requete); |
(DB::isError($resultat)) ? die(BOG_afficherErreurSql(__FILE__, __LINE__, $resultat->getMessage(), $requete)) : ''; |
|
//---------------------------------------------------------------------------- |
// Récupération des infos |
$tab_retour = array(); |
while ($info_article = $resultat->fetchRow(DB_FETCHMODE_OBJECT)) { |
$tab_retour[$info_article->id_article] = $info_article; |
} |
$resultat->free(); |
|
return $tab_retour; |
} |
|
// Fichier : inc_texte.php3 |
function couper($texte, $taille = 50) |
{ |
$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */ |
|
// on utilise les \r pour passer entre les gouttes |
$texte = str_replace("\r\n", "\n", $texte); |
$texte = str_replace("\r", "\n", $texte); |
|
// sauts de ligne et paragraphes |
$texte = ereg_replace("\n\n+", "\r", $texte); |
$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte); |
|
// supprimer les traits, lignes etc |
$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte); |
|
// supprimer les tags |
$texte = $this->supprimer_tags($texte); |
$texte = trim(str_replace("\n"," ", $texte)); |
$texte .= "\n"; // marquer la fin |
|
// travailler en accents charset |
// On supprime dans Papyrus car cela tire trop de fonctions... |
//$texte = $this->filtrer_entites($texte); |
|
// supprimer les liens |
$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte |
$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte); |
|
// supprimer les notes |
$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte); |
|
// supprimer les codes typos |
$texte = ereg_replace("[}{]", "", $texte); |
|
// supprimer les tableaux |
$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte); |
|
// couper au mot precedent |
$long = $this->spip_substr($texte, 0, max($taille-4,1)); |
$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long); |
$points = ' (...)'; |
|
// trop court ? ne pas faire de (...) |
if (strlen($court) < max(0.75 * $taille,2)) { |
$points = ''; |
$long = $this->spip_substr($texte, 0, $taille); |
$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long); |
// encore trop court ? couper au caractere |
if (strlen($texte) < 0.75 * $taille) |
$texte = $long; |
} else |
$texte = $court; |
|
if (strpos($texte, "\n")) // la fin est encore la : c'est qu'on n'a pas de texte de suite |
$points = ''; |
|
// remettre les paragraphes |
$texte = ereg_replace("\r+", "\n\n", $texte); |
|
// supprimer l'eventuelle entite finale mal coupee |
$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte); |
|
return trim($texte).$points; |
} |
|
// Gerer les outils mb_string |
// Fichier : inc_texte.php3 |
function spip_substr($c, $start=0, $end='') |
{ |
// methode substr normale |
if ($end) { |
return substr($c, $start, $end); |
} else { |
return substr($c, $start); |
} |
} |
|
// Suppression basique et brutale de tous les <...> |
// Fichier : inc_filtres.php3 |
function supprimer_tags($texte, $rempl = "") |
{ |
$texte = preg_replace(",<[^>]*>,U", $rempl, $texte); |
// ne pas oublier un < final non ferme |
$texte = str_replace('<', ' ', $texte); |
return $texte; |
} |
|
} |
|
/* +--Fin du code ----------------------------------------------------------------------------------------+ |
* |
* $Log$ |
* |
* +-- Fin du code ----------------------------------------------------------------------------------------+ |
*/ |
?> |