New file |
0,0 → 1,384 |
<?php |
/*vim: set expandtab tabstop=4 shiftwidth=4: */ |
// +------------------------------------------------------------------------------------------------------+ |
// | PHP version 4.1 | |
// +------------------------------------------------------------------------------------------------------+ |
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org) | |
// +------------------------------------------------------------------------------------------------------+ |
// | This file is part of Papyrus. | |
// | | |
// | Foobar is free software; you can redistribute it and/or modify | |
// | it under the terms of the GNU General Public License as published by | |
// | the Free Software Foundation; either version 2 of the License, or | |
// | (at your option) any later version. | |
// | | |
// | Foobar is distributed in the hope that it will be useful, | |
// | but WITHOUT ANY WARRANTY; without even the implied warranty of | |
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the | |
// | GNU General Public License for more details. | |
// | | |
// | You should have received a copy of the GNU General Public License | |
// | along with Foobar; if not, write to the Free Software | |
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA | |
// +------------------------------------------------------------------------------------------------------+ |
// CVS : $Id: more_recherche.class.php,v 1.15 2008-11-04 17:34:37 aperonnet Exp $ |
/** |
* Classe permettant d'effectuer des recherches sur les métas informations des menus. |
* |
* Permet de rechercher et classer les menus en fonction d'une chaine. |
* |
*@package Applette |
*@subpackage Moteur_Recherche |
//Auteur original : |
*@author Jean-Pascal MILCENT <jpm@tela-botanica.org> |
//Autres auteurs : |
*@author aucun |
*@copyright Tela-Botanica 2000-2004 |
*@version $Revision: 1.15 $ $Date: 2008-11-04 17:34:37 $ |
// +------------------------------------------------------------------------------------------------------+ |
*/ |
|
// +------------------------------------------------------------------------------------------------------+ |
// | ENTETE du PROGRAMME | |
// +------------------------------------------------------------------------------------------------------+ |
|
|
// +------------------------------------------------------------------------------------------------------+ |
// | CORPS du PROGRAMME | |
// +------------------------------------------------------------------------------------------------------+ |
|
class More_Recherche { |
var $motif = ''; |
var $moteurs_recherches = array(); |
var $resultats = array(); |
|
// Constructeur |
function More_Recherche($motif) { |
$this->setMotif($motif); |
} |
|
// Accesseurs |
function getMotif() { |
return $this->motif; |
} |
function setMotif($motif) { |
$this->motif = $motif ; |
} |
function getMoteurs() { |
return $this->moteurs_recherches; |
} |
function getMoteur($id) { |
return $this->moteurs_recherches[$id]; |
} |
function setMoteur($val) { |
$id_nouveau = count($this->moteurs_recherches); |
$this->moteurs_recherches[$id_nouveau] = $val; |
} |
function getResultats() { |
return $this->resultats; |
} |
function setResultats($val) { |
$this->resultats = $val; |
} |
function setResultat($aso_page) { |
$id_nouveau = count($this->resultats); |
$this->resultats[$id_nouveau] = $aso_page; |
} |
|
// Méthodes |
function eliminerAccents($motif) |
{ |
return strtr($motif,"ÀÁÂÃÄÅàáâãäåÒÓÔÕÖØòóôõöøÈÉÊËèéêëÌÍÎÏìíîïÙÚÛÜùúûüÿÑñÇç'", |
"AAAAAAaaaaaaOOOOOOooooooEEEEeeeeIIIIiiiiUUUUuuuuyNnCc " ); |
} |
|
function ajouterRecherche(&$objet_recherche) { |
return $this->setMoteur($objet_recherche); |
} |
|
function rechercherMotif() { |
foreach ($this->getMoteurs() as $cle => $val) { |
$this->setResultats(array_merge((array)$this->getResultats(),(array)$val->rechercherMotif($this->getMotif()))); |
} |
$aso_resultats = $this->getResultats(); |
|
// on teste l'existence de la fonction anonyme car sinon bug d'inclusion très pénible ! |
if (!function_exists('comparer')) { |
|
function comparer($a, $b) { |
if ($a['poids'] > $b['poids']) { |
return -1; |
} |
if ($a['poids'] < $b['poids']) { |
return +1; |
} |
if ($a['poids'] = $b['poids']) { |
return 0; |
} |
} |
} |
usort($aso_resultats, 'comparer'); |
$pds_max = 0; |
if (isset($aso_resultats[0]['poids'])) { |
$pds_max = $aso_resultats[0]['poids']; |
} |
for ($i = 0 ; $i < count($aso_resultats) ; $i++) { |
$aso_resultats[$i]['score'] = round((100 / $pds_max) * $aso_resultats[$i]['poids'], 1); |
} |
|
return $aso_resultats; |
} |
|
/** Renvoie le nombre d'occurences total de la présence de chaque mot. |
* |
* @param string le motif à rechercher. |
* @param string le texte dans lequel effectuer la recherche. |
* @return integer le nombre de fois où les mots sont trouvés. |
*/ |
function retournerOccurenceMotif($motif, &$texte, $mode = MORE_MODE) |
{ |
$nbre_correspondance = 0; |
$nbre_correspondance_total = 0; |
$motif = $this->traiterMotif($motif, 'simple'); |
// Si demande de recherche d'expression complète |
if (preg_match('/^".+"$/', $motif)) { |
$mode = 2; |
|
} |
$motif = $this->traiterMotif($motif, 'recherche'); |
switch ($mode) { |
case '1' : |
// Découpage en mot |
$tab_motif = explode(' ', $motif); |
break; |
case '2' : |
// La chaine saisie par l'utilisateur est recherchée tel quel |
$tab_motif[] = $motif; |
break; |
default: |
$e = 'Mode pour le moteur de recherche inconnu : '.$mode. |
trigger_error($e, E_USER_ERROR); |
} |
// Nous recherchons chaque mot |
$compteur_mot = 0; |
foreach ($tab_motif as $mot) { |
//$nbre_correspondance += preg_match_all('/'.$mot.'/i', $texte, $tab_morceaux); |
$nbre_correspondance = substr_count($this->eliminerAccents(strtolower($texte)), $this->eliminerAccents(strtolower($mot))); |
if ($nbre_correspondance > 0) { |
$compteur_mot++; |
} |
$nbre_correspondance_total += $nbre_correspondance; |
} |
// Si tous les mots recherchés sont présents nous renvoyons le poids de la page. |
if ($compteur_mot == count($tab_motif)) { |
return $nbre_correspondance_total; |
} else { |
return 0; |
} |
} |
|
function traiterMotif($motif, $type = 0) |
{ |
switch ($type) { |
case 'simple' : |
return trim(stripslashes($motif)); |
break; |
case 'recherche' : |
if (preg_match('/^"(.+)"$/', $motif, $match)) { |
$motif = $match[1]; |
} |
return $motif; |
break; |
case 'url' : |
$motif = trim(stripslashes($motif)); |
if (preg_match('/^"(.+)"$/', $motif, $match)) { |
$motif = $match[1]; |
} |
return urlencode($motif); |
break; |
default: |
return $motif; |
} |
} |
|
function traduireMois($mois_numerique) |
{ |
switch ($mois_numerique) { |
case '01' : |
return 'janvier'; |
case '02' : |
return 'février'; |
case '03' : |
return 'mars'; |
case '04' : |
return 'avril'; |
case '05' : |
return 'mai'; |
case '06' : |
return 'juin'; |
case '07' : |
return 'juillet'; |
case '08' : |
return 'août'; |
case '09' : |
return 'septembre'; |
case '10' : |
return 'octobre'; |
case '11' : |
return 'novembre'; |
case '12' : |
return 'décembre'; |
default: |
return ''; |
} |
} |
|
/** |
* Coupe un texte suivant une taille donnée, pour éviter qu'il ne soit |
* trop long lors de l'affichage |
* @param String texte à couper |
* @param int taille maximum du texte |
*/ |
function couperTexte($texte, $taille = 50) |
{ |
$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */ |
|
// on utilise les \r pour passer entre les gouttes |
$texte = str_replace("\r\n", "\n", $texte); |
$texte = str_replace("\r", "\n", $texte); |
|
// sauts de ligne et paragraphes |
$texte = ereg_replace("\n\n+", "\r", $texte); |
$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte); |
|
// supprimer les traits, lignes etc |
$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte); |
|
// supprimer les tags |
$texte = $this->supprimerTags($texte); |
$texte = trim(str_replace("\n"," ", $texte)); |
$texte .= "\n"; // marquer la fin |
|
// travailler en accents charset |
// On supprime dans Papyrus car cela tire trop de fonctions... |
//$texte = $this->filtrer_entites($texte); |
|
// supprimer les liens |
$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte |
$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte); |
|
// supprimer les notes |
$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte); |
|
// supprimer les codes typos |
$texte = ereg_replace("[}{]", "", $texte); |
|
// supprimer les tableaux |
$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte); |
|
// couper au mot precedent |
$long = $this->gererSubstr($texte, 0, max($taille-4,1)); |
$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long); |
$points = MORE_LG_RESULTAT_ETC; |
|
// trop court ? ne pas faire de (...) |
if (strlen($court) < max(0.75 * $taille,2)) { |
$points = ''; |
$long = $this->gererSubstr($texte, 0, $taille); |
$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long); |
// encore trop court ? couper au caractere |
if (strlen($texte) < 0.75 * $taille) |
$texte = $long; |
} else |
$texte = $court; |
|
if (strpos($texte, "\n")) // la fin est encore la : c'est qu'on n'a pas de texte de suite |
$points = ''; |
|
// remettre les paragraphes |
$texte = ereg_replace("\r+", "\n\n", $texte); |
|
// supprimer l'eventuelle entite finale mal coupee |
$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte); |
|
return trim($texte).$points; |
} |
|
// Gerer les outils mb_string |
// Fichier : inc_texte.php3 |
function gererSubstr($c, $start=0, $end='') |
{ |
// methode substr normale |
if ($end) { |
return substr($c, $start, $end); |
} else { |
return substr($c, $start); |
} |
} |
|
// Suppression basique et brutale de tous les <...> |
// Fichier : inc_filtres.php3 |
function supprimerTags($texte, $rempl = "") |
{ |
$texte = preg_replace(",<[^>]*>,U", $rempl, $texte); |
// ne pas oublier un < final non ferme |
$texte = str_replace('<', ' ', $texte); |
return $texte; |
} |
} |
|
/* +--Fin du code ----------------------------------------------------------------------------------------+ |
* |
* $Log: not supported by cvs2svn $ |
* Revision 1.14 2008-10-21 16:54:18 aperonnet |
* correction de bug de double inclusion de fichier quand une balise syndication est présente dans la page |
* |
* Revision 1.13 2008-10-21 15:24:50 aperonnet |
* Ajout de résultats issus des fiches de bazar pour le moteur de recherche |
* |
* Revision 1.12 2007-10-29 18:29:30 jp_milcent |
* Ajout d'un préfixe devant les classes de l'applette pour éviter les conflits avec d'autres classes provenant des applis clientes. |
* |
* Revision 1.11 2007-01-02 18:49:22 jp_milcent |
* Amélioration de la gestion du motif. |
* Ajout de la gestion des expressions complête via l'utilisation de guillemets. |
* |
* Revision 1.10 2006/12/12 13:54:41 jp_milcent |
* Correction bogue : variable non initialisée. |
* |
* Revision 1.9 2006/10/17 09:21:40 jp_milcent |
* Mise en commun des spécifications de la recherche. |
* |
* Revision 1.8 2006/05/23 14:18:19 jp_milcent |
* Ajout de la gestion du mode de recherche au moteur de recherche de Papyrus. |
* Soit on recherche chaque mot du motif, soit le motif entier. |
* |
* Revision 1.7 2006/05/19 10:04:55 jp_milcent |
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip. |
* |
* Revision 1.6 2006/04/28 12:41:49 florian |
* corrections erreurs chemin |
* |
* Revision 1.5 2005/09/20 17:01:22 ddelon |
* php5 et bugs divers |
* |
* Revision 1.4 2005/05/25 13:49:22 jpm |
* Corection erreur pour la recherche dans le contenu. |
* |
* Revision 1.3 2005/05/19 12:46:12 jpm |
* Correction bogue accesskey. |
* Ajout d'un id à la liste. |
* Arrondissement des score. |
* |
* Revision 1.2 2005/04/14 17:39:34 jpm |
* Amélioration du moteur de rechercher : |
* - pourcentage |
* - ajout d'info |
* |
* Revision 1.1 2004/12/07 10:24:06 jpm |
* Moteur de recherche version de départ. |
* |
* |
* +-- Fin du code ----------------------------------------------------------------------------------------+ |
*/ |
?> |
Property changes: |
Added: svn:executable |
+* |
\ No newline at end of property |