Subversion Repositories Applications.papyrus

Rev

Rev 1678 | Rev 1934 | Go to most recent revision | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
217 jpm 1
<?php
2
/*vim: set expandtab tabstop=4 shiftwidth=4: */
3
// +------------------------------------------------------------------------------------------------------+
4
// | PHP version 4.1                                                                                      |
5
// +------------------------------------------------------------------------------------------------------+
6
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org)                                         |
7
// +------------------------------------------------------------------------------------------------------+
8
// | This file is part of Papyrus.                                                                        |
9
// |                                                                                                      |
10
// | Foobar is free software; you can redistribute it and/or modify                                       |
11
// | it under the terms of the GNU General Public License as published by                                 |
12
// | the Free Software Foundation; either version 2 of the License, or                                    |
13
// | (at your option) any later version.                                                                  |
14
// |                                                                                                      |
15
// | Foobar is distributed in the hope that it will be useful,                                            |
16
// | but WITHOUT ANY WARRANTY; without even the implied warranty of                                       |
17
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the                                        |
18
// | GNU General Public License for more details.                                                         |
19
// |                                                                                                      |
20
// | You should have received a copy of the GNU General Public License                                    |
21
// | along with Foobar; if not, write to the Free Software                                                |
22
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA                            |
23
// +------------------------------------------------------------------------------------------------------+
1933 aperonnet 24
// CVS : $Id: more_recherche.class.php,v 1.13 2008-10-21 15:24:50 aperonnet Exp $
217 jpm 25
/**
26
* Classe permettant d'effectuer des recherches sur les métas informations des menus.
27
*
28
* Permet de rechercher et classer les menus en fonction d'une chaine.
29
*
30
*@package Applette
31
*@subpackage Moteur_Recherche
32
//Auteur original :
33
*@author        Jean-Pascal MILCENT <jpm@tela-botanica.org>
34
//Autres auteurs :
35
*@author        aucun
36
*@copyright     Tela-Botanica 2000-2004
1933 aperonnet 37
*@version       $Revision: 1.13 $ $Date: 2008-10-21 15:24:50 $
217 jpm 38
// +------------------------------------------------------------------------------------------------------+
39
*/
40
 
41
// +------------------------------------------------------------------------------------------------------+
42
// |                                            ENTETE du PROGRAMME                                       |
43
// +------------------------------------------------------------------------------------------------------+
44
 
45
 
46
// +------------------------------------------------------------------------------------------------------+
47
// |                                            CORPS du PROGRAMME                                        |
48
// +------------------------------------------------------------------------------------------------------+
49
 
1678 jp_milcent 50
class More_Recherche {
217 jpm 51
    var $motif = '';
52
    var $moteurs_recherches = array();
53
    var $resultats = array();
54
 
55
    // Constructeur
1678 jp_milcent 56
    function More_Recherche($motif) {
217 jpm 57
        $this->setMotif($motif);
58
    }
59
 
60
    // Accesseurs
61
    function getMotif() {
62
        return $this->motif;
63
    }
64
    function setMotif($motif) {
65
        $this->motif = $motif;
66
    }
67
    function getMoteurs() {
68
        return $this->moteurs_recherches;
69
    }
70
    function getMoteur($id) {
71
        return $this->moteurs_recherches[$id];
72
    }
73
    function setMoteur($val) {
74
        $id_nouveau = count($this->moteurs_recherches);
75
        $this->moteurs_recherches[$id_nouveau] = $val;
76
    }
77
    function getResultats() {
78
        return $this->resultats;
79
    }
80
    function setResultats($val) {
81
        $this->resultats = $val;
82
    }
83
    function setResultat($aso_page) {
84
        $id_nouveau = count($this->resultats);
85
        $this->resultats[$id_nouveau] = $aso_page;
86
    }
87
 
88
    // Méthodes
89
 
90
    function ajouterRecherche(&$objet_recherche) {
91
        return $this->setMoteur($objet_recherche);
92
    }
846 jp_milcent 93
 
217 jpm 94
    function rechercherMotif() {
95
        foreach ($this->getMoteurs() as $cle => $val) {
846 jp_milcent 96
            $this->setResultats(array_merge((array)$this->getResultats(),(array)$val->rechercherMotif($this->getMotif())));
217 jpm 97
        }
98
        $aso_resultats = $this->getResultats();
99
        function comparer($a, $b) {
100
            if ($a['poids'] > $b['poids']) {
101
                return -1;
102
            }
103
            if ($a['poids'] < $b['poids']) {
104
                return +1;
105
            }
106
            if ($a['poids'] = $b['poids']) {
107
                return 0;
108
            }
109
        }
110
        usort($aso_resultats, 'comparer');
373 jpm 111
        $pds_max = 0;
112
        if (isset($aso_resultats[0]['poids'])) {
113
            $pds_max = $aso_resultats[0]['poids'];
114
        }
339 jpm 115
        for ($i = 0 ; $i < count($aso_resultats) ; $i++) {
368 jpm 116
            $aso_resultats[$i]['score'] = round((100 / $pds_max) * $aso_resultats[$i]['poids'], 1);
339 jpm 117
        }
118
 
217 jpm 119
        return $aso_resultats;
120
    }
339 jpm 121
 
846 jp_milcent 122
    /** Renvoie le nombre d'occurences total de la présence de chaque mot.
123
	*
124
	* @param  string	le motif à rechercher.
125
	* @param  string	le texte dans lequel effectuer la recherche.
126
	* @return integer	le nombre de fois où les mots sont trouvés.
127
	*/
851 jp_milcent 128
	function retournerOccurenceMotif($motif, &$texte, $mode = MORE_MODE)
846 jp_milcent 129
	{
130
		$nbre_correspondance = 0;
1146 jp_milcent 131
		$nbre_correspondance_total = 0;
1183 jp_milcent 132
		$motif = $this->traiterMotif($motif, 'simple');
133
		// Si demande de recherche d'expression complète
134
		if (preg_match('/^".+"$/', $motif)) {
135
			$mode = 2;
136
 
851 jp_milcent 137
		}
1183 jp_milcent 138
		$motif = $this->traiterMotif($motif, 'recherche');
139
		switch ($mode) {
140
			case '1' :
141
				// Découpage en mot
142
				$tab_motif = explode(' ', $motif);
143
				break;
144
			case '2' :
145
				// La chaine saisie par l'utilisateur est recherchée tel quel
146
				$tab_motif[] = $motif;
147
				break;
148
			default:
149
				$e = 'Mode pour le moteur de recherche inconnu : '.$mode.
150
				trigger_error($e, E_USER_ERROR);
151
		}
846 jp_milcent 152
		// Nous recherchons chaque mot
1034 jp_milcent 153
		$compteur_mot = 0;
846 jp_milcent 154
		foreach ($tab_motif as $mot) {
155
			//$nbre_correspondance += preg_match_all('/'.$mot.'/i', $texte, $tab_morceaux);
1183 jp_milcent 156
			$nbre_correspondance = substr_count(strtolower($texte), strtolower($mot));
1034 jp_milcent 157
			if ($nbre_correspondance > 0) {
158
				$compteur_mot++;
159
			}
160
			$nbre_correspondance_total += $nbre_correspondance;
846 jp_milcent 161
		}
1034 jp_milcent 162
		// Si tous les mots recherchés sont présents nous renvoyons le poids de la page.
163
		if ($compteur_mot == count($tab_motif)) {
164
			return $nbre_correspondance_total;
165
		} else {
166
			return 0;
167
		}
846 jp_milcent 168
	}
169
 
1183 jp_milcent 170
	function traiterMotif($motif, $type = 0)
171
    {
172
    	switch ($type) {
173
			case 'simple' :
174
				return trim(stripslashes($motif));
175
				break;
176
			case 'recherche' :
177
				if (preg_match('/^"(.+)"$/', $motif, $match)) {
178
					$motif = $match[1];
179
				}
180
				return $motif;
181
				break;
182
			case 'url' :
183
				$motif = trim(stripslashes($motif));
184
				if (preg_match('/^"(.+)"$/', $motif, $match)) {
185
					$motif = $match[1];
186
				}
187
				return urlencode($motif);
188
				break;
189
			default:
190
				return $motif;
191
		}
192
    }
193
 
339 jpm 194
    function traduireMois($mois_numerique)
195
    {
196
        switch ($mois_numerique) {
197
            case '01' :
832 florian 198
                return 'janvier';
339 jpm 199
            case '02' :
832 florian 200
                return 'février';
339 jpm 201
            case '03' :
202
                return 'mars';
203
            case '04' :
204
                return 'avril';
205
            case '05' :
206
                return 'mai';
207
            case '06' :
208
                return 'juin';
209
            case '07' :
210
                return 'juillet';
211
            case '08' :
212
                return 'août';
213
            case '09' :
214
                return 'septembre';
215
            case '10' :
216
                return 'octobre';
217
            case '11' :
218
                return 'novembre';
219
            case '12' :
220
                return 'décembre';
221
            default:
222
                return '';
223
        }
224
    }
1933 aperonnet 225
 
226
    /**
227
     * Coupe un texte suivant une taille donnée, pour éviter qu'il ne soit
228
     * trop long lors de l'affichage
229
     * @param String texte à couper
230
     * @param int taille maximum du texte
231
     */
232
	function couperTexte($texte, $taille = 50)
233
	{
234
		$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
235
 
236
		// on utilise les \r pour passer entre les gouttes
237
		$texte = str_replace("\r\n", "\n", $texte);
238
		$texte = str_replace("\r", "\n", $texte);
239
 
240
		// sauts de ligne et paragraphes
241
		$texte = ereg_replace("\n\n+", "\r", $texte);
242
		$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
243
 
244
		// supprimer les traits, lignes etc
245
		$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
246
 
247
		// supprimer les tags
248
		$texte = $this->supprimerTags($texte);
249
		$texte = trim(str_replace("\n"," ", $texte));
250
		$texte .= "\n";	// marquer la fin
251
 
252
		// travailler en accents charset
253
		// On supprime dans Papyrus car cela tire trop de fonctions...
254
		//$texte = $this->filtrer_entites($texte);
255
 
256
		// supprimer les liens
257
		$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
258
		$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
259
 
260
		// supprimer les notes
261
		$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
262
 
263
		// supprimer les codes typos
264
		$texte = ereg_replace("[}{]", "", $texte);
265
 
266
		// supprimer les tableaux
267
		$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
268
 
269
		// couper au mot precedent
270
		$long = $this->gererSubstr($texte, 0, max($taille-4,1));
271
		$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
272
		$points = MORE_LG_RESULTAT_ETC;
273
 
274
		// trop court ? ne pas faire de (...)
275
		if (strlen($court) < max(0.75 * $taille,2)) {
276
			$points = '';
277
			$long = $this->gererSubstr($texte, 0, $taille);
278
			$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
279
			// encore trop court ? couper au caractere
280
			if (strlen($texte) < 0.75 * $taille)
281
				$texte = $long;
282
		} else
283
			$texte = $court;
284
 
285
		if (strpos($texte, "\n"))	// la fin est encore la : c'est qu'on n'a pas de texte de suite
286
			$points = '';
287
 
288
		// remettre les paragraphes
289
		$texte = ereg_replace("\r+", "\n\n", $texte);
290
 
291
		// supprimer l'eventuelle entite finale mal coupee
292
		$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
293
 
294
		return trim($texte).$points;
295
	}
296
 
297
	// Gerer les outils mb_string
298
	// Fichier : inc_texte.php3
299
	function gererSubstr($c, $start=0, $end='')
300
	{
301
		// methode substr normale
302
		if ($end) {
303
			return substr($c, $start, $end);
304
		} else {
305
			return substr($c, $start);
306
		}
307
	}
308
 
309
	// Suppression basique et brutale de tous les <...>
310
	// Fichier : inc_filtres.php3
311
	function supprimerTags($texte, $rempl = "")
312
	{
313
		$texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
314
		// ne pas oublier un < final non ferme
315
		$texte = str_replace('<', ' ', $texte);
316
		return $texte;
317
	}
217 jpm 318
}
319
 
320
/* +--Fin du code ----------------------------------------------------------------------------------------+
321
*
322
* $Log: not supported by cvs2svn $
1933 aperonnet 323
* Revision 1.12  2007-10-29 18:29:30  jp_milcent
324
* Ajout d'un préfixe devant les classes de l'applette pour éviter les conflits avec d'autres classes provenant des applis clientes.
325
*
1678 jp_milcent 326
* Revision 1.11  2007-01-02 18:49:22  jp_milcent
327
* Amélioration de la gestion du motif.
328
* Ajout de la gestion des expressions complête via l'utilisation de guillemets.
329
*
1183 jp_milcent 330
* Revision 1.10  2006/12/12 13:54:41  jp_milcent
331
* Correction bogue : variable non initialisée.
332
*
1146 jp_milcent 333
* Revision 1.9  2006/10/17 09:21:40  jp_milcent
334
* Mise en commun des spécifications de la recherche.
335
*
1034 jp_milcent 336
* Revision 1.8  2006/05/23 14:18:19  jp_milcent
337
* Ajout de la gestion du mode de recherche au moteur de recherche de Papyrus.
338
* Soit on recherche chaque mot du motif, soit le motif entier.
339
*
851 jp_milcent 340
* Revision 1.7  2006/05/19 10:04:55  jp_milcent
341
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
342
*
846 jp_milcent 343
* Revision 1.6  2006/04/28 12:41:49  florian
344
* corrections erreurs chemin
345
*
832 florian 346
* Revision 1.5  2005/09/20 17:01:22  ddelon
347
* php5 et bugs divers
348
*
443 ddelon 349
* Revision 1.4  2005/05/25 13:49:22  jpm
350
* Corection erreur pour la recherche dans le contenu.
351
*
373 jpm 352
* Revision 1.3  2005/05/19 12:46:12  jpm
353
* Correction bogue accesskey.
354
* Ajout d'un id à la liste.
355
* Arrondissement des score.
356
*
368 jpm 357
* Revision 1.2  2005/04/14 17:39:34  jpm
358
* Amélioration du moteur de rechercher :
359
*  - pourcentage
360
*  - ajout d'info
361
*
339 jpm 362
* Revision 1.1  2004/12/07 10:24:06  jpm
363
* Moteur de recherche version de départ.
364
*
217 jpm 365
*
366
* +-- Fin du code ----------------------------------------------------------------------------------------+
367
*/
368
?>