Subversion Repositories Applications.papyrus

Rev

Rev 1964 | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
217 jpm 1
<?php
2
/*vim: set expandtab tabstop=4 shiftwidth=4: */
3
// +------------------------------------------------------------------------------------------------------+
4
// | PHP version 4.1                                                                                      |
5
// +------------------------------------------------------------------------------------------------------+
6
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org)                                         |
7
// +------------------------------------------------------------------------------------------------------+
8
// | This file is part of Papyrus.                                                                        |
9
// |                                                                                                      |
10
// | Foobar is free software; you can redistribute it and/or modify                                       |
11
// | it under the terms of the GNU General Public License as published by                                 |
12
// | the Free Software Foundation; either version 2 of the License, or                                    |
13
// | (at your option) any later version.                                                                  |
14
// |                                                                                                      |
15
// | Foobar is distributed in the hope that it will be useful,                                            |
16
// | but WITHOUT ANY WARRANTY; without even the implied warranty of                                       |
17
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the                                        |
18
// | GNU General Public License for more details.                                                         |
19
// |                                                                                                      |
20
// | You should have received a copy of the GNU General Public License                                    |
21
// | along with Foobar; if not, write to the Free Software                                                |
22
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA                            |
23
// +------------------------------------------------------------------------------------------------------+
1964 aperonnet 24
// CVS : $Id: more_recherche.class.php,v 1.15 2008-11-04 17:34:37 aperonnet Exp $
217 jpm 25
/**
26
* Classe permettant d'effectuer des recherches sur les métas informations des menus.
27
*
28
* Permet de rechercher et classer les menus en fonction d'une chaine.
29
*
30
*@package Applette
31
*@subpackage Moteur_Recherche
32
//Auteur original :
33
*@author        Jean-Pascal MILCENT <jpm@tela-botanica.org>
34
//Autres auteurs :
35
*@author        aucun
36
*@copyright     Tela-Botanica 2000-2004
1964 aperonnet 37
*@version       $Revision: 1.15 $ $Date: 2008-11-04 17:34:37 $
217 jpm 38
// +------------------------------------------------------------------------------------------------------+
39
*/
40
 
41
// +------------------------------------------------------------------------------------------------------+
42
// |                                            ENTETE du PROGRAMME                                       |
43
// +------------------------------------------------------------------------------------------------------+
44
 
45
 
46
// +------------------------------------------------------------------------------------------------------+
47
// |                                            CORPS du PROGRAMME                                        |
48
// +------------------------------------------------------------------------------------------------------+
49
 
1678 jp_milcent 50
class More_Recherche {
217 jpm 51
    var $motif = '';
52
    var $moteurs_recherches = array();
53
    var $resultats = array();
54
 
55
    // Constructeur
1678 jp_milcent 56
    function More_Recherche($motif) {
217 jpm 57
        $this->setMotif($motif);
58
    }
59
 
60
    // Accesseurs
61
    function getMotif() {
62
        return $this->motif;
63
    }
64
    function setMotif($motif) {
1964 aperonnet 65
        $this->motif = $motif ;
217 jpm 66
    }
67
    function getMoteurs() {
68
        return $this->moteurs_recherches;
69
    }
70
    function getMoteur($id) {
71
        return $this->moteurs_recherches[$id];
72
    }
73
    function setMoteur($val) {
74
        $id_nouveau = count($this->moteurs_recherches);
75
        $this->moteurs_recherches[$id_nouveau] = $val;
76
    }
77
    function getResultats() {
78
        return $this->resultats;
79
    }
80
    function setResultats($val) {
81
        $this->resultats = $val;
82
    }
83
    function setResultat($aso_page) {
84
        $id_nouveau = count($this->resultats);
85
        $this->resultats[$id_nouveau] = $aso_page;
86
    }
87
 
88
    // Méthodes
1964 aperonnet 89
    function eliminerAccents($motif)
90
    {
91
    	return strtr($motif,"ÀÁÂÃÄÅàáâãäåÒÓÔÕÖØòóôõöøÈÉÊËèéêëÌÍÎÏìíîïÙÚÛÜùúûüÿÑñÇç'",
92
                 "AAAAAAaaaaaaOOOOOOooooooEEEEeeeeIIIIiiiiUUUUuuuuyNnCc " );
93
    }
217 jpm 94
 
95
    function ajouterRecherche(&$objet_recherche) {
96
        return $this->setMoteur($objet_recherche);
97
    }
846 jp_milcent 98
 
217 jpm 99
    function rechercherMotif() {
100
        foreach ($this->getMoteurs() as $cle => $val) {
846 jp_milcent 101
            $this->setResultats(array_merge((array)$this->getResultats(),(array)$val->rechercherMotif($this->getMotif())));
217 jpm 102
        }
103
        $aso_resultats = $this->getResultats();
1934 aperonnet 104
 
105
        // on teste l'existence de la fonction anonyme car sinon bug d'inclusion très pénible !
1964 aperonnet 106
	    if (!function_exists('comparer')) {
1934 aperonnet 107
 
108
	       	function comparer($a, $b) {
109
	            if ($a['poids'] > $b['poids']) {
110
	                return -1;
111
	            }
112
	            if ($a['poids'] < $b['poids']) {
113
	                return +1;
114
	            }
115
	            if ($a['poids'] = $b['poids']) {
116
	                return 0;
117
	            }
118
	        }
119
	    }
217 jpm 120
        usort($aso_resultats, 'comparer');
373 jpm 121
        $pds_max = 0;
122
        if (isset($aso_resultats[0]['poids'])) {
123
            $pds_max = $aso_resultats[0]['poids'];
124
        }
339 jpm 125
        for ($i = 0 ; $i < count($aso_resultats) ; $i++) {
368 jpm 126
            $aso_resultats[$i]['score'] = round((100 / $pds_max) * $aso_resultats[$i]['poids'], 1);
339 jpm 127
        }
128
 
217 jpm 129
        return $aso_resultats;
130
    }
339 jpm 131
 
846 jp_milcent 132
    /** Renvoie le nombre d'occurences total de la présence de chaque mot.
133
	*
134
	* @param  string	le motif à rechercher.
135
	* @param  string	le texte dans lequel effectuer la recherche.
136
	* @return integer	le nombre de fois où les mots sont trouvés.
137
	*/
851 jp_milcent 138
	function retournerOccurenceMotif($motif, &$texte, $mode = MORE_MODE)
846 jp_milcent 139
	{
140
		$nbre_correspondance = 0;
1146 jp_milcent 141
		$nbre_correspondance_total = 0;
2104 drzraf 142
		$motif = self::traiterMotif($motif, 'simple');
1183 jp_milcent 143
		// Si demande de recherche d'expression complète
144
		if (preg_match('/^".+"$/', $motif)) {
145
			$mode = 2;
146
 
851 jp_milcent 147
		}
2104 drzraf 148
		$motif = self::traiterMotif($motif, 'recherche');
1183 jp_milcent 149
		switch ($mode) {
150
			case '1' :
151
				// Découpage en mot
152
				$tab_motif = explode(' ', $motif);
153
				break;
154
			case '2' :
155
				// La chaine saisie par l'utilisateur est recherchée tel quel
156
				$tab_motif[] = $motif;
157
				break;
158
			default:
159
				$e = 'Mode pour le moteur de recherche inconnu : '.$mode.
160
				trigger_error($e, E_USER_ERROR);
161
		}
846 jp_milcent 162
		// Nous recherchons chaque mot
1034 jp_milcent 163
		$compteur_mot = 0;
846 jp_milcent 164
		foreach ($tab_motif as $mot) {
165
			//$nbre_correspondance += preg_match_all('/'.$mot.'/i', $texte, $tab_morceaux);
1964 aperonnet 166
			$nbre_correspondance = substr_count($this->eliminerAccents(strtolower($texte)), $this->eliminerAccents(strtolower($mot)));
1034 jp_milcent 167
			if ($nbre_correspondance > 0) {
168
				$compteur_mot++;
169
			}
170
			$nbre_correspondance_total += $nbre_correspondance;
846 jp_milcent 171
		}
1034 jp_milcent 172
		// Si tous les mots recherchés sont présents nous renvoyons le poids de la page.
173
		if ($compteur_mot == count($tab_motif)) {
174
			return $nbre_correspondance_total;
175
		} else {
176
			return 0;
177
		}
846 jp_milcent 178
	}
179
 
2104 drzraf 180
	static function traiterMotif($motif, $type = 0)
1964 aperonnet 181
    {
1183 jp_milcent 182
    	switch ($type) {
183
			case 'simple' :
184
				return trim(stripslashes($motif));
185
				break;
186
			case 'recherche' :
187
				if (preg_match('/^"(.+)"$/', $motif, $match)) {
188
					$motif = $match[1];
189
				}
190
				return $motif;
191
				break;
192
			case 'url' :
193
				$motif = trim(stripslashes($motif));
194
				if (preg_match('/^"(.+)"$/', $motif, $match)) {
195
					$motif = $match[1];
196
				}
197
				return urlencode($motif);
198
				break;
199
			default:
200
				return $motif;
201
		}
202
    }
2104 drzraf 203
 
339 jpm 204
    function traduireMois($mois_numerique)
205
    {
206
        switch ($mois_numerique) {
207
            case '01' :
832 florian 208
                return 'janvier';
339 jpm 209
            case '02' :
832 florian 210
                return 'février';
339 jpm 211
            case '03' :
212
                return 'mars';
213
            case '04' :
214
                return 'avril';
215
            case '05' :
216
                return 'mai';
217
            case '06' :
218
                return 'juin';
219
            case '07' :
220
                return 'juillet';
221
            case '08' :
222
                return 'août';
223
            case '09' :
224
                return 'septembre';
225
            case '10' :
226
                return 'octobre';
227
            case '11' :
228
                return 'novembre';
229
            case '12' :
230
                return 'décembre';
231
            default:
232
                return '';
233
        }
234
    }
1933 aperonnet 235
 
236
    /**
237
     * Coupe un texte suivant une taille donnée, pour éviter qu'il ne soit
238
     * trop long lors de l'affichage
239
     * @param String texte à couper
240
     * @param int taille maximum du texte
241
     */
2104 drzraf 242
	static function couperTexte($texte, $taille = 50)
1933 aperonnet 243
	{
244
		$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
245
 
246
		// on utilise les \r pour passer entre les gouttes
247
		$texte = str_replace("\r\n", "\n", $texte);
248
		$texte = str_replace("\r", "\n", $texte);
249
 
250
		// sauts de ligne et paragraphes
251
		$texte = ereg_replace("\n\n+", "\r", $texte);
252
		$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
253
 
254
		// supprimer les traits, lignes etc
255
		$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
256
 
257
		// supprimer les tags
2104 drzraf 258
		$texte = self::supprimerTags($texte);
1933 aperonnet 259
		$texte = trim(str_replace("\n"," ", $texte));
260
		$texte .= "\n";	// marquer la fin
261
 
262
		// travailler en accents charset
263
		// On supprime dans Papyrus car cela tire trop de fonctions...
264
		//$texte = $this->filtrer_entites($texte);
265
 
266
		// supprimer les liens
267
		$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
268
		$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
269
 
270
		// supprimer les notes
271
		$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
272
 
273
		// supprimer les codes typos
274
		$texte = ereg_replace("[}{]", "", $texte);
275
 
276
		// supprimer les tableaux
277
		$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
278
 
279
		// couper au mot precedent
2104 drzraf 280
		$long = self::gererSubstr($texte, 0, max($taille-4,1));
1933 aperonnet 281
		$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
282
		$points = MORE_LG_RESULTAT_ETC;
283
 
284
		// trop court ? ne pas faire de (...)
285
		if (strlen($court) < max(0.75 * $taille,2)) {
286
			$points = '';
2104 drzraf 287
			$long = self::gererSubstr($texte, 0, $taille);
1933 aperonnet 288
			$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
289
			// encore trop court ? couper au caractere
290
			if (strlen($texte) < 0.75 * $taille)
291
				$texte = $long;
292
		} else
293
			$texte = $court;
294
 
295
		if (strpos($texte, "\n"))	// la fin est encore la : c'est qu'on n'a pas de texte de suite
296
			$points = '';
297
 
298
		// remettre les paragraphes
299
		$texte = ereg_replace("\r+", "\n\n", $texte);
300
 
301
		// supprimer l'eventuelle entite finale mal coupee
302
		$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
303
 
304
		return trim($texte).$points;
305
	}
306
 
307
	// Gerer les outils mb_string
308
	// Fichier : inc_texte.php3
2104 drzraf 309
	static function gererSubstr($c, $start=0, $end='')
1933 aperonnet 310
	{
311
		// methode substr normale
312
		if ($end) {
313
			return substr($c, $start, $end);
314
		} else {
315
			return substr($c, $start);
316
		}
317
	}
318
 
319
	// Suppression basique et brutale de tous les <...>
320
	// Fichier : inc_filtres.php3
2104 drzraf 321
	static function supprimerTags($texte, $rempl = "")
1933 aperonnet 322
	{
323
		$texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
324
		// ne pas oublier un < final non ferme
325
		$texte = str_replace('<', ' ', $texte);
326
		return $texte;
327
	}
217 jpm 328
}
329
 
330
/* +--Fin du code ----------------------------------------------------------------------------------------+
331
*
332
* $Log: not supported by cvs2svn $
1964 aperonnet 333
* Revision 1.14  2008-10-21 16:54:18  aperonnet
334
* correction de bug de double inclusion de fichier quand une balise syndication est présente dans la page
335
*
1934 aperonnet 336
* Revision 1.13  2008-10-21 15:24:50  aperonnet
337
* Ajout de résultats issus des fiches de bazar pour le moteur de recherche
338
*
1933 aperonnet 339
* Revision 1.12  2007-10-29 18:29:30  jp_milcent
340
* Ajout d'un préfixe devant les classes de l'applette pour éviter les conflits avec d'autres classes provenant des applis clientes.
341
*
1678 jp_milcent 342
* Revision 1.11  2007-01-02 18:49:22  jp_milcent
343
* Amélioration de la gestion du motif.
344
* Ajout de la gestion des expressions complête via l'utilisation de guillemets.
345
*
1183 jp_milcent 346
* Revision 1.10  2006/12/12 13:54:41  jp_milcent
347
* Correction bogue : variable non initialisée.
348
*
1146 jp_milcent 349
* Revision 1.9  2006/10/17 09:21:40  jp_milcent
350
* Mise en commun des spécifications de la recherche.
351
*
1034 jp_milcent 352
* Revision 1.8  2006/05/23 14:18:19  jp_milcent
353
* Ajout de la gestion du mode de recherche au moteur de recherche de Papyrus.
354
* Soit on recherche chaque mot du motif, soit le motif entier.
355
*
851 jp_milcent 356
* Revision 1.7  2006/05/19 10:04:55  jp_milcent
357
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
358
*
846 jp_milcent 359
* Revision 1.6  2006/04/28 12:41:49  florian
360
* corrections erreurs chemin
361
*
832 florian 362
* Revision 1.5  2005/09/20 17:01:22  ddelon
363
* php5 et bugs divers
364
*
443 ddelon 365
* Revision 1.4  2005/05/25 13:49:22  jpm
366
* Corection erreur pour la recherche dans le contenu.
367
*
373 jpm 368
* Revision 1.3  2005/05/19 12:46:12  jpm
369
* Correction bogue accesskey.
370
* Ajout d'un id à la liste.
371
* Arrondissement des score.
372
*
368 jpm 373
* Revision 1.2  2005/04/14 17:39:34  jpm
374
* Amélioration du moteur de rechercher :
375
*  - pourcentage
376
*  - ajout d'info
377
*
339 jpm 378
* Revision 1.1  2004/12/07 10:24:06  jpm
379
* Moteur de recherche version de départ.
380
*
217 jpm 381
*
382
* +-- Fin du code ----------------------------------------------------------------------------------------+
383
*/
384
?>