Subversion Repositories Applications.papyrus

Rev

Rev 1933 | Rev 1964 | Go to most recent revision | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
217 jpm 1
<?php
2
/*vim: set expandtab tabstop=4 shiftwidth=4: */
3
// +------------------------------------------------------------------------------------------------------+
4
// | PHP version 4.1                                                                                      |
5
// +------------------------------------------------------------------------------------------------------+
6
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org)                                         |
7
// +------------------------------------------------------------------------------------------------------+
8
// | This file is part of Papyrus.                                                                        |
9
// |                                                                                                      |
10
// | Foobar is free software; you can redistribute it and/or modify                                       |
11
// | it under the terms of the GNU General Public License as published by                                 |
12
// | the Free Software Foundation; either version 2 of the License, or                                    |
13
// | (at your option) any later version.                                                                  |
14
// |                                                                                                      |
15
// | Foobar is distributed in the hope that it will be useful,                                            |
16
// | but WITHOUT ANY WARRANTY; without even the implied warranty of                                       |
17
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the                                        |
18
// | GNU General Public License for more details.                                                         |
19
// |                                                                                                      |
20
// | You should have received a copy of the GNU General Public License                                    |
21
// | along with Foobar; if not, write to the Free Software                                                |
22
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA                            |
23
// +------------------------------------------------------------------------------------------------------+
1934 aperonnet 24
// CVS : $Id: more_recherche.class.php,v 1.14 2008-10-21 16:54:18 aperonnet Exp $
217 jpm 25
/**
26
* Classe permettant d'effectuer des recherches sur les métas informations des menus.
27
*
28
* Permet de rechercher et classer les menus en fonction d'une chaine.
29
*
30
*@package Applette
31
*@subpackage Moteur_Recherche
32
//Auteur original :
33
*@author        Jean-Pascal MILCENT <jpm@tela-botanica.org>
34
//Autres auteurs :
35
*@author        aucun
36
*@copyright     Tela-Botanica 2000-2004
1934 aperonnet 37
*@version       $Revision: 1.14 $ $Date: 2008-10-21 16:54:18 $
217 jpm 38
// +------------------------------------------------------------------------------------------------------+
39
*/
40
 
41
// +------------------------------------------------------------------------------------------------------+
42
// |                                            ENTETE du PROGRAMME                                       |
43
// +------------------------------------------------------------------------------------------------------+
44
 
45
 
46
// +------------------------------------------------------------------------------------------------------+
47
// |                                            CORPS du PROGRAMME                                        |
48
// +------------------------------------------------------------------------------------------------------+
49
 
1678 jp_milcent 50
class More_Recherche {
217 jpm 51
    var $motif = '';
52
    var $moteurs_recherches = array();
53
    var $resultats = array();
54
 
55
    // Constructeur
1678 jp_milcent 56
    function More_Recherche($motif) {
217 jpm 57
        $this->setMotif($motif);
58
    }
59
 
60
    // Accesseurs
61
    function getMotif() {
62
        return $this->motif;
63
    }
64
    function setMotif($motif) {
65
        $this->motif = $motif;
66
    }
67
    function getMoteurs() {
68
        return $this->moteurs_recherches;
69
    }
70
    function getMoteur($id) {
71
        return $this->moteurs_recherches[$id];
72
    }
73
    function setMoteur($val) {
74
        $id_nouveau = count($this->moteurs_recherches);
75
        $this->moteurs_recherches[$id_nouveau] = $val;
76
    }
77
    function getResultats() {
78
        return $this->resultats;
79
    }
80
    function setResultats($val) {
81
        $this->resultats = $val;
82
    }
83
    function setResultat($aso_page) {
84
        $id_nouveau = count($this->resultats);
85
        $this->resultats[$id_nouveau] = $aso_page;
86
    }
87
 
88
    // Méthodes
89
 
90
    function ajouterRecherche(&$objet_recherche) {
91
        return $this->setMoteur($objet_recherche);
92
    }
846 jp_milcent 93
 
217 jpm 94
    function rechercherMotif() {
95
        foreach ($this->getMoteurs() as $cle => $val) {
846 jp_milcent 96
            $this->setResultats(array_merge((array)$this->getResultats(),(array)$val->rechercherMotif($this->getMotif())));
217 jpm 97
        }
98
        $aso_resultats = $this->getResultats();
1934 aperonnet 99
 
100
        // on teste l'existence de la fonction anonyme car sinon bug d'inclusion très pénible !
101
	    if (function_exists('comparer')) {
102
 
103
	       	function comparer($a, $b) {
104
	            if ($a['poids'] > $b['poids']) {
105
	                return -1;
106
	            }
107
	            if ($a['poids'] < $b['poids']) {
108
	                return +1;
109
	            }
110
	            if ($a['poids'] = $b['poids']) {
111
	                return 0;
112
	            }
113
	        }
114
	    }
217 jpm 115
        usort($aso_resultats, 'comparer');
373 jpm 116
        $pds_max = 0;
117
        if (isset($aso_resultats[0]['poids'])) {
118
            $pds_max = $aso_resultats[0]['poids'];
119
        }
339 jpm 120
        for ($i = 0 ; $i < count($aso_resultats) ; $i++) {
368 jpm 121
            $aso_resultats[$i]['score'] = round((100 / $pds_max) * $aso_resultats[$i]['poids'], 1);
339 jpm 122
        }
123
 
217 jpm 124
        return $aso_resultats;
125
    }
339 jpm 126
 
846 jp_milcent 127
    /** Renvoie le nombre d'occurences total de la présence de chaque mot.
128
	*
129
	* @param  string	le motif à rechercher.
130
	* @param  string	le texte dans lequel effectuer la recherche.
131
	* @return integer	le nombre de fois où les mots sont trouvés.
132
	*/
851 jp_milcent 133
	function retournerOccurenceMotif($motif, &$texte, $mode = MORE_MODE)
846 jp_milcent 134
	{
135
		$nbre_correspondance = 0;
1146 jp_milcent 136
		$nbre_correspondance_total = 0;
1183 jp_milcent 137
		$motif = $this->traiterMotif($motif, 'simple');
138
		// Si demande de recherche d'expression complète
139
		if (preg_match('/^".+"$/', $motif)) {
140
			$mode = 2;
141
 
851 jp_milcent 142
		}
1183 jp_milcent 143
		$motif = $this->traiterMotif($motif, 'recherche');
144
		switch ($mode) {
145
			case '1' :
146
				// Découpage en mot
147
				$tab_motif = explode(' ', $motif);
148
				break;
149
			case '2' :
150
				// La chaine saisie par l'utilisateur est recherchée tel quel
151
				$tab_motif[] = $motif;
152
				break;
153
			default:
154
				$e = 'Mode pour le moteur de recherche inconnu : '.$mode.
155
				trigger_error($e, E_USER_ERROR);
156
		}
846 jp_milcent 157
		// Nous recherchons chaque mot
1034 jp_milcent 158
		$compteur_mot = 0;
846 jp_milcent 159
		foreach ($tab_motif as $mot) {
160
			//$nbre_correspondance += preg_match_all('/'.$mot.'/i', $texte, $tab_morceaux);
1183 jp_milcent 161
			$nbre_correspondance = substr_count(strtolower($texte), strtolower($mot));
1034 jp_milcent 162
			if ($nbre_correspondance > 0) {
163
				$compteur_mot++;
164
			}
165
			$nbre_correspondance_total += $nbre_correspondance;
846 jp_milcent 166
		}
1034 jp_milcent 167
		// Si tous les mots recherchés sont présents nous renvoyons le poids de la page.
168
		if ($compteur_mot == count($tab_motif)) {
169
			return $nbre_correspondance_total;
170
		} else {
171
			return 0;
172
		}
846 jp_milcent 173
	}
174
 
1183 jp_milcent 175
	function traiterMotif($motif, $type = 0)
176
    {
177
    	switch ($type) {
178
			case 'simple' :
179
				return trim(stripslashes($motif));
180
				break;
181
			case 'recherche' :
182
				if (preg_match('/^"(.+)"$/', $motif, $match)) {
183
					$motif = $match[1];
184
				}
185
				return $motif;
186
				break;
187
			case 'url' :
188
				$motif = trim(stripslashes($motif));
189
				if (preg_match('/^"(.+)"$/', $motif, $match)) {
190
					$motif = $match[1];
191
				}
192
				return urlencode($motif);
193
				break;
194
			default:
195
				return $motif;
196
		}
197
    }
198
 
339 jpm 199
    function traduireMois($mois_numerique)
200
    {
201
        switch ($mois_numerique) {
202
            case '01' :
832 florian 203
                return 'janvier';
339 jpm 204
            case '02' :
832 florian 205
                return 'février';
339 jpm 206
            case '03' :
207
                return 'mars';
208
            case '04' :
209
                return 'avril';
210
            case '05' :
211
                return 'mai';
212
            case '06' :
213
                return 'juin';
214
            case '07' :
215
                return 'juillet';
216
            case '08' :
217
                return 'août';
218
            case '09' :
219
                return 'septembre';
220
            case '10' :
221
                return 'octobre';
222
            case '11' :
223
                return 'novembre';
224
            case '12' :
225
                return 'décembre';
226
            default:
227
                return '';
228
        }
229
    }
1933 aperonnet 230
 
231
    /**
232
     * Coupe un texte suivant une taille donnée, pour éviter qu'il ne soit
233
     * trop long lors de l'affichage
234
     * @param String texte à couper
235
     * @param int taille maximum du texte
236
     */
237
	function couperTexte($texte, $taille = 50)
238
	{
239
		$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
240
 
241
		// on utilise les \r pour passer entre les gouttes
242
		$texte = str_replace("\r\n", "\n", $texte);
243
		$texte = str_replace("\r", "\n", $texte);
244
 
245
		// sauts de ligne et paragraphes
246
		$texte = ereg_replace("\n\n+", "\r", $texte);
247
		$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
248
 
249
		// supprimer les traits, lignes etc
250
		$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
251
 
252
		// supprimer les tags
253
		$texte = $this->supprimerTags($texte);
254
		$texte = trim(str_replace("\n"," ", $texte));
255
		$texte .= "\n";	// marquer la fin
256
 
257
		// travailler en accents charset
258
		// On supprime dans Papyrus car cela tire trop de fonctions...
259
		//$texte = $this->filtrer_entites($texte);
260
 
261
		// supprimer les liens
262
		$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
263
		$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
264
 
265
		// supprimer les notes
266
		$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
267
 
268
		// supprimer les codes typos
269
		$texte = ereg_replace("[}{]", "", $texte);
270
 
271
		// supprimer les tableaux
272
		$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
273
 
274
		// couper au mot precedent
275
		$long = $this->gererSubstr($texte, 0, max($taille-4,1));
276
		$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
277
		$points = MORE_LG_RESULTAT_ETC;
278
 
279
		// trop court ? ne pas faire de (...)
280
		if (strlen($court) < max(0.75 * $taille,2)) {
281
			$points = '';
282
			$long = $this->gererSubstr($texte, 0, $taille);
283
			$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
284
			// encore trop court ? couper au caractere
285
			if (strlen($texte) < 0.75 * $taille)
286
				$texte = $long;
287
		} else
288
			$texte = $court;
289
 
290
		if (strpos($texte, "\n"))	// la fin est encore la : c'est qu'on n'a pas de texte de suite
291
			$points = '';
292
 
293
		// remettre les paragraphes
294
		$texte = ereg_replace("\r+", "\n\n", $texte);
295
 
296
		// supprimer l'eventuelle entite finale mal coupee
297
		$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
298
 
299
		return trim($texte).$points;
300
	}
301
 
302
	// Gerer les outils mb_string
303
	// Fichier : inc_texte.php3
304
	function gererSubstr($c, $start=0, $end='')
305
	{
306
		// methode substr normale
307
		if ($end) {
308
			return substr($c, $start, $end);
309
		} else {
310
			return substr($c, $start);
311
		}
312
	}
313
 
314
	// Suppression basique et brutale de tous les <...>
315
	// Fichier : inc_filtres.php3
316
	function supprimerTags($texte, $rempl = "")
317
	{
318
		$texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
319
		// ne pas oublier un < final non ferme
320
		$texte = str_replace('<', ' ', $texte);
321
		return $texte;
322
	}
217 jpm 323
}
324
 
325
/* +--Fin du code ----------------------------------------------------------------------------------------+
326
*
327
* $Log: not supported by cvs2svn $
1934 aperonnet 328
* Revision 1.13  2008-10-21 15:24:50  aperonnet
329
* Ajout de résultats issus des fiches de bazar pour le moteur de recherche
330
*
1933 aperonnet 331
* Revision 1.12  2007-10-29 18:29:30  jp_milcent
332
* Ajout d'un préfixe devant les classes de l'applette pour éviter les conflits avec d'autres classes provenant des applis clientes.
333
*
1678 jp_milcent 334
* Revision 1.11  2007-01-02 18:49:22  jp_milcent
335
* Amélioration de la gestion du motif.
336
* Ajout de la gestion des expressions complête via l'utilisation de guillemets.
337
*
1183 jp_milcent 338
* Revision 1.10  2006/12/12 13:54:41  jp_milcent
339
* Correction bogue : variable non initialisée.
340
*
1146 jp_milcent 341
* Revision 1.9  2006/10/17 09:21:40  jp_milcent
342
* Mise en commun des spécifications de la recherche.
343
*
1034 jp_milcent 344
* Revision 1.8  2006/05/23 14:18:19  jp_milcent
345
* Ajout de la gestion du mode de recherche au moteur de recherche de Papyrus.
346
* Soit on recherche chaque mot du motif, soit le motif entier.
347
*
851 jp_milcent 348
* Revision 1.7  2006/05/19 10:04:55  jp_milcent
349
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
350
*
846 jp_milcent 351
* Revision 1.6  2006/04/28 12:41:49  florian
352
* corrections erreurs chemin
353
*
832 florian 354
* Revision 1.5  2005/09/20 17:01:22  ddelon
355
* php5 et bugs divers
356
*
443 ddelon 357
* Revision 1.4  2005/05/25 13:49:22  jpm
358
* Corection erreur pour la recherche dans le contenu.
359
*
373 jpm 360
* Revision 1.3  2005/05/19 12:46:12  jpm
361
* Correction bogue accesskey.
362
* Ajout d'un id à la liste.
363
* Arrondissement des score.
364
*
368 jpm 365
* Revision 1.2  2005/04/14 17:39:34  jpm
366
* Amélioration du moteur de rechercher :
367
*  - pourcentage
368
*  - ajout d'info
369
*
339 jpm 370
* Revision 1.1  2004/12/07 10:24:06  jpm
371
* Moteur de recherche version de départ.
372
*
217 jpm 373
*
374
* +-- Fin du code ----------------------------------------------------------------------------------------+
375
*/
376
?>