Subversion Repositories Applications.papyrus

Rev

Rev 1935 | Blame | Last modification | View Log | RSS feed

<?php
/*vim: set expandtab tabstop=4 shiftwidth=4: */ 
// +------------------------------------------------------------------------------------------------------+
// | PHP version 4.1                                                                                      |
// +------------------------------------------------------------------------------------------------------+
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org)                                         |
// +------------------------------------------------------------------------------------------------------+
// | This file is part of Papyrus.                                                                        |
// |                                                                                                      |
// | Foobar is free software; you can redistribute it and/or modify                                       |
// | it under the terms of the GNU General Public License as published by                                 |
// | the Free Software Foundation; either version 2 of the License, or                                    |
// | (at your option) any later version.                                                                  |
// |                                                                                                      |
// | Foobar is distributed in the hope that it will be useful,                                            |
// | but WITHOUT ANY WARRANTY; without even the implied warranty of                                       |
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the                                        |
// | GNU General Public License for more details.                                                         |
// |                                                                                                      |
// | You should have received a copy of the GNU General Public License                                    |
// | along with Foobar; if not, write to the Free Software                                                |
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA                            |
// +------------------------------------------------------------------------------------------------------+
// CVS : $Id: more_recherche.class.php,v 1.12.2.2 2008-11-19 09:30:18 aperonnet Exp $
/**
* Classe permettant d'effectuer des recherches sur les métas informations des menus.
*
* Permet de rechercher et classer les menus en fonction d'une chaine.
*
*@package Applette
*@subpackage Moteur_Recherche
//Auteur original :
*@author        Jean-Pascal MILCENT <jpm@tela-botanica.org>
//Autres auteurs :
*@author        aucun
*@copyright     Tela-Botanica 2000-2004
*@version       $Revision: 1.12.2.2 $ $Date: 2008-11-19 09:30:18 $
// +------------------------------------------------------------------------------------------------------+
*/

// +------------------------------------------------------------------------------------------------------+
// |                                            ENTETE du PROGRAMME                                       |
// +------------------------------------------------------------------------------------------------------+


// +------------------------------------------------------------------------------------------------------+
// |                                            CORPS du PROGRAMME                                        |
// +------------------------------------------------------------------------------------------------------+

class More_Recherche {
    var $motif = '';
    var $moteurs_recherches = array();
    var $resultats = array();
    
    // Constructeur
    function More_Recherche($motif) {
        $this->setMotif($motif);
    }
    
    // Accesseurs
    function getMotif() {
        return $this->motif;
    }
    function setMotif($motif) {
        $this->motif = $motif ;
    }
    function getMoteurs() {
        return $this->moteurs_recherches;
    }
    function getMoteur($id) {
        return $this->moteurs_recherches[$id];
    }
    function setMoteur($val) {
        $id_nouveau = count($this->moteurs_recherches);
        $this->moteurs_recherches[$id_nouveau] = $val;
    }
    function getResultats() {
        return $this->resultats;
    }
    function setResultats($val) {
        $this->resultats = $val;
    }
    function setResultat($aso_page) {
        $id_nouveau = count($this->resultats);
        $this->resultats[$id_nouveau] = $aso_page;
    }
    
    // Méthodes
    function eliminerAccents($motif)
    {
        return strtr($motif,"ÀÁÂÃÄÅàáâãäåÒÓÔÕÖØòóôõöøÈÉÊËèéêëÌÍÎÏìíîïÙÚÛÜùúûüÿÑñÇç'",
                 "AAAAAAaaaaaaOOOOOOooooooEEEEeeeeIIIIiiiiUUUUuuuuyNnCc " ); 
    }
    
    function ajouterRecherche(&$objet_recherche) {
        return $this->setMoteur($objet_recherche);
    }

    function rechercherMotif() {
        foreach ($this->getMoteurs() as $cle => $val) {
            $this->setResultats(array_merge((array)$this->getResultats(),(array)$val->rechercherMotif($this->getMotif())));
        }
        $aso_resultats = $this->getResultats();
        
        // on teste l'existence de la fonction anonyme car sinon bug d'inclusion très pénible !
            if (!function_exists('comparer')) {
                
                function comparer($a, $b) {
                    if ($a['poids'] > $b['poids']) {
                        return -1;
                    }
                    if ($a['poids'] < $b['poids']) {
                        return +1;
                    }
                    if ($a['poids'] = $b['poids']) {
                        return 0;
                    }
                }
            }
        usort($aso_resultats, 'comparer');
        $pds_max = 0;
        if (isset($aso_resultats[0]['poids'])) {
            $pds_max = $aso_resultats[0]['poids'];
        }
        for ($i = 0 ; $i < count($aso_resultats) ; $i++) {
            $aso_resultats[$i]['score'] = round((100 / $pds_max) * $aso_resultats[$i]['poids'], 1);
        }
        
        return $aso_resultats;
    }
    
    /** Renvoie le nombre d'occurences total de la présence de chaque mot.
        *
        * @param  string        le motif à rechercher.
        * @param  string        le texte dans lequel effectuer la recherche. 
        * @return integer       le nombre de fois où les mots sont trouvés.
        */
        function retournerOccurenceMotif($motif, &$texte, $mode = MORE_MODE)
        {
                $nbre_correspondance = 0;
                $nbre_correspondance_total = 0;
                $motif = $this->traiterMotif($motif, 'simple');
                // Si demande de recherche d'expression complète
                if (preg_match('/^".+"$/', $motif)) {
                        $mode = 2;
                        
                }
                $motif = $this->traiterMotif($motif, 'recherche');
                switch ($mode) {
                        case '1' :
                                // Découpage en mot
                                $tab_motif = explode(' ', $motif);
                                break;
                        case '2' :
                                // La chaine saisie par l'utilisateur est recherchée tel quel
                                $tab_motif[] = $motif;
                                break;
                        default:
                                $e = 'Mode pour le moteur de recherche inconnu : '.$mode.
                                trigger_error($e, E_USER_ERROR);
                }
                // Nous recherchons chaque mot
                $compteur_mot = 0;
                foreach ($tab_motif as $mot) {
                        //$nbre_correspondance += preg_match_all('/'.$mot.'/i', $texte, $tab_morceaux);
                        $nbre_correspondance = substr_count($this->eliminerAccents(strtolower($texte)), $this->eliminerAccents(strtolower($mot)));
                        if ($nbre_correspondance > 0) {
                                $compteur_mot++;
                        }
                        $nbre_correspondance_total += $nbre_correspondance; 
                }
                // Si tous les mots recherchés sont présents nous renvoyons le poids de la page.
                if ($compteur_mot == count($tab_motif)) {
                        return $nbre_correspondance_total;
                } else {
                        return 0;
                }
        }
        
        function traiterMotif($motif, $type = 0)
    {   
        switch ($type) {
                        case 'simple' :
                                return trim(stripslashes($motif));
                                break;
                        case 'recherche' :
                                if (preg_match('/^"(.+)"$/', $motif, $match)) {
                                        $motif = $match[1];
                                }
                                return $motif;
                                break;
                        case 'url' :
                                $motif = trim(stripslashes($motif));
                                if (preg_match('/^"(.+)"$/', $motif, $match)) {
                                        $motif = $match[1];
                                }
                                return urlencode($motif);
                                break;
                        default:
                                return $motif;
                }
    }
    
    function traduireMois($mois_numerique)
    {
        switch ($mois_numerique) {
            case '01' :
                return 'janvier';              
            case '02' :
                return 'février';              
            case '03' :
                return 'mars';
            case '04' :
                return 'avril';
            case '05' :
                return 'mai';
            case '06' :
                return 'juin';
            case '07' :
                return 'juillet';
            case '08' :
                return 'août';
            case '09' :
                return 'septembre';
            case '10' :
                return 'octobre';
            case '11' :
                return 'novembre';
            case '12' :
                return 'décembre';
            default:
                return '';
        }
    }
    
    /**
     * Coupe un texte suivant une taille donnée, pour éviter qu'il ne soit 
     * trop long lors de l'affichage
     * @param String texte à couper
     * @param int taille maximum du texte
     */
        function couperTexte($texte, $taille = 50)
        {
                $texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
        
                // on utilise les \r pour passer entre les gouttes
                $texte = str_replace("\r\n", "\n", $texte);
                $texte = str_replace("\r", "\n", $texte);
        
                // sauts de ligne et paragraphes
                $texte = ereg_replace("\n\n+", "\r", $texte);
                $texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
        
                // supprimer les traits, lignes etc
                $texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
        
                // supprimer les tags
                $texte = $this->supprimerTags($texte);
                $texte = trim(str_replace("\n"," ", $texte));
                $texte .= "\n"; // marquer la fin
        
                // travailler en accents charset
                // On supprime dans Papyrus car cela tire trop de fonctions...
                //$texte = $this->filtrer_entites($texte);
        
                // supprimer les liens
                $texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
                $texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
        
                // supprimer les notes
                $texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
        
                // supprimer les codes typos
                $texte = ereg_replace("[}{]", "", $texte);
        
                // supprimer les tableaux
                $texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
        
                // couper au mot precedent
                $long = $this->gererSubstr($texte, 0, max($taille-4,1));
                $court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
                $points = MORE_LG_RESULTAT_ETC;
        
                // trop court ? ne pas faire de (...)
                if (strlen($court) < max(0.75 * $taille,2)) {
                        $points = '';
                        $long = $this->gererSubstr($texte, 0, $taille);
                        $texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
                        // encore trop court ? couper au caractere
                        if (strlen($texte) < 0.75 * $taille)
                                $texte = $long;
                } else
                        $texte = $court;
        
                if (strpos($texte, "\n"))       // la fin est encore la : c'est qu'on n'a pas de texte de suite
                        $points = '';
        
                // remettre les paragraphes
                $texte = ereg_replace("\r+", "\n\n", $texte);
        
                // supprimer l'eventuelle entite finale mal coupee
                $texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
        
                return trim($texte).$points;
        }
        
        // Gerer les outils mb_string
        // Fichier : inc_texte.php3     
        function gererSubstr($c, $start=0, $end='')
        {
                // methode substr normale
                if ($end) {
                        return substr($c, $start, $end);
                } else {
                        return substr($c, $start);
                }
        }

        // Suppression basique et brutale de tous les <...>
        // Fichier : inc_filtres.php3
        function supprimerTags($texte, $rempl = "")
        {
                $texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
                // ne pas oublier un < final non ferme
                $texte = str_replace('<', ' ', $texte);
                return $texte;
        }
}

/* +--Fin du code ----------------------------------------------------------------------------------------+
*
* $Log: not supported by cvs2svn $
* Revision 1.15  2008-11-04 17:34:37  aperonnet
* le moteur de recherche donne les même résultats avec ou sans accents
*
* Revision 1.14  2008-10-21 16:54:18  aperonnet
* correction de bug de double inclusion de fichier quand une balise syndication est présente dans la page
*
* Revision 1.13  2008-10-21 15:24:50  aperonnet
* Ajout de résultats issus des fiches de bazar pour le moteur de recherche
*
* Revision 1.12  2007-10-29 18:29:30  jp_milcent
* Ajout d'un préfixe devant les classes de l'applette pour éviter les conflits avec d'autres classes provenant des applis clientes.
*
* Revision 1.11  2007-01-02 18:49:22  jp_milcent
* Amélioration de la gestion du motif.
* Ajout de la gestion des expressions complête via l'utilisation de guillemets.
*
* Revision 1.10  2006/12/12 13:54:41  jp_milcent
* Correction bogue : variable non initialisée.
*
* Revision 1.9  2006/10/17 09:21:40  jp_milcent
* Mise en commun des spécifications de la recherche.
*
* Revision 1.8  2006/05/23 14:18:19  jp_milcent
* Ajout de la gestion du mode de recherche au moteur de recherche de Papyrus.
* Soit on recherche chaque mot du motif, soit le motif entier.
*
* Revision 1.7  2006/05/19 10:04:55  jp_milcent
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
*
* Revision 1.6  2006/04/28 12:41:49  florian
* corrections erreurs chemin
*
* Revision 1.5  2005/09/20 17:01:22  ddelon
* php5 et bugs divers
*
* Revision 1.4  2005/05/25 13:49:22  jpm
* Corection erreur pour la recherche dans le contenu.
*
* Revision 1.3  2005/05/19 12:46:12  jpm
* Correction bogue accesskey.
* Ajout d'un id à la liste.
* Arrondissement des score.
*
* Revision 1.2  2005/04/14 17:39:34  jpm
* Amélioration du moteur de rechercher :
*  - pourcentage
*  - ajout d'info
*
* Revision 1.1  2004/12/07 10:24:06  jpm
* Moteur de recherche version de départ.
*
* 
* +-- Fin du code ----------------------------------------------------------------------------------------+
*/
?>