217 |
jpm |
1 |
<?php
|
|
|
2 |
/*vim: set expandtab tabstop=4 shiftwidth=4: */
|
|
|
3 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
4 |
// | PHP version 4.1 |
|
|
|
5 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
6 |
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org) |
|
|
|
7 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
8 |
// | This file is part of Papyrus. |
|
|
|
9 |
// | |
|
|
|
10 |
// | Foobar is free software; you can redistribute it and/or modify |
|
|
|
11 |
// | it under the terms of the GNU General Public License as published by |
|
|
|
12 |
// | the Free Software Foundation; either version 2 of the License, or |
|
|
|
13 |
// | (at your option) any later version. |
|
|
|
14 |
// | |
|
|
|
15 |
// | Foobar is distributed in the hope that it will be useful, |
|
|
|
16 |
// | but WITHOUT ANY WARRANTY; without even the implied warranty of |
|
|
|
17 |
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the |
|
|
|
18 |
// | GNU General Public License for more details. |
|
|
|
19 |
// | |
|
|
|
20 |
// | You should have received a copy of the GNU General Public License |
|
|
|
21 |
// | along with Foobar; if not, write to the Free Software |
|
|
|
22 |
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA 02111-1307 USA |
|
|
|
23 |
// +------------------------------------------------------------------------------------------------------+
|
1964 |
aperonnet |
24 |
// CVS : $Id: more_recherche.class.php,v 1.15 2008-11-04 17:34:37 aperonnet Exp $
|
217 |
jpm |
25 |
/**
|
|
|
26 |
* Classe permettant d'effectuer des recherches sur les métas informations des menus.
|
|
|
27 |
*
|
|
|
28 |
* Permet de rechercher et classer les menus en fonction d'une chaine.
|
|
|
29 |
*
|
|
|
30 |
*@package Applette
|
|
|
31 |
*@subpackage Moteur_Recherche
|
|
|
32 |
//Auteur original :
|
|
|
33 |
*@author Jean-Pascal MILCENT <jpm@tela-botanica.org>
|
|
|
34 |
//Autres auteurs :
|
|
|
35 |
*@author aucun
|
|
|
36 |
*@copyright Tela-Botanica 2000-2004
|
1964 |
aperonnet |
37 |
*@version $Revision: 1.15 $ $Date: 2008-11-04 17:34:37 $
|
217 |
jpm |
38 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
39 |
*/
|
|
|
40 |
|
|
|
41 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
42 |
// | ENTETE du PROGRAMME |
|
|
|
43 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
44 |
|
|
|
45 |
|
|
|
46 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
47 |
// | CORPS du PROGRAMME |
|
|
|
48 |
// +------------------------------------------------------------------------------------------------------+
|
|
|
49 |
|
1678 |
jp_milcent |
50 |
class More_Recherche {
|
217 |
jpm |
51 |
var $motif = '';
|
|
|
52 |
var $moteurs_recherches = array();
|
|
|
53 |
var $resultats = array();
|
|
|
54 |
|
|
|
55 |
// Constructeur
|
1678 |
jp_milcent |
56 |
function More_Recherche($motif) {
|
217 |
jpm |
57 |
$this->setMotif($motif);
|
|
|
58 |
}
|
|
|
59 |
|
|
|
60 |
// Accesseurs
|
|
|
61 |
function getMotif() {
|
|
|
62 |
return $this->motif;
|
|
|
63 |
}
|
|
|
64 |
function setMotif($motif) {
|
1964 |
aperonnet |
65 |
$this->motif = $motif ;
|
217 |
jpm |
66 |
}
|
|
|
67 |
function getMoteurs() {
|
|
|
68 |
return $this->moteurs_recherches;
|
|
|
69 |
}
|
|
|
70 |
function getMoteur($id) {
|
|
|
71 |
return $this->moteurs_recherches[$id];
|
|
|
72 |
}
|
|
|
73 |
function setMoteur($val) {
|
|
|
74 |
$id_nouveau = count($this->moteurs_recherches);
|
|
|
75 |
$this->moteurs_recherches[$id_nouveau] = $val;
|
|
|
76 |
}
|
|
|
77 |
function getResultats() {
|
|
|
78 |
return $this->resultats;
|
|
|
79 |
}
|
|
|
80 |
function setResultats($val) {
|
|
|
81 |
$this->resultats = $val;
|
|
|
82 |
}
|
|
|
83 |
function setResultat($aso_page) {
|
|
|
84 |
$id_nouveau = count($this->resultats);
|
|
|
85 |
$this->resultats[$id_nouveau] = $aso_page;
|
|
|
86 |
}
|
|
|
87 |
|
|
|
88 |
// Méthodes
|
1964 |
aperonnet |
89 |
function eliminerAccents($motif)
|
|
|
90 |
{
|
|
|
91 |
return strtr($motif,"ÀÁÂÃÄÅàáâãäåÒÓÔÕÖØòóôõöøÈÉÊËèéêëÌÍÎÏìíîïÙÚÛÜùúûüÿÑñÇç'",
|
|
|
92 |
"AAAAAAaaaaaaOOOOOOooooooEEEEeeeeIIIIiiiiUUUUuuuuyNnCc " );
|
|
|
93 |
}
|
217 |
jpm |
94 |
|
|
|
95 |
function ajouterRecherche(&$objet_recherche) {
|
|
|
96 |
return $this->setMoteur($objet_recherche);
|
|
|
97 |
}
|
846 |
jp_milcent |
98 |
|
217 |
jpm |
99 |
function rechercherMotif() {
|
|
|
100 |
foreach ($this->getMoteurs() as $cle => $val) {
|
846 |
jp_milcent |
101 |
$this->setResultats(array_merge((array)$this->getResultats(),(array)$val->rechercherMotif($this->getMotif())));
|
217 |
jpm |
102 |
}
|
|
|
103 |
$aso_resultats = $this->getResultats();
|
1934 |
aperonnet |
104 |
|
|
|
105 |
// on teste l'existence de la fonction anonyme car sinon bug d'inclusion très pénible !
|
1964 |
aperonnet |
106 |
if (!function_exists('comparer')) {
|
1934 |
aperonnet |
107 |
|
|
|
108 |
function comparer($a, $b) {
|
|
|
109 |
if ($a['poids'] > $b['poids']) {
|
|
|
110 |
return -1;
|
|
|
111 |
}
|
|
|
112 |
if ($a['poids'] < $b['poids']) {
|
|
|
113 |
return +1;
|
|
|
114 |
}
|
|
|
115 |
if ($a['poids'] = $b['poids']) {
|
|
|
116 |
return 0;
|
|
|
117 |
}
|
|
|
118 |
}
|
|
|
119 |
}
|
217 |
jpm |
120 |
usort($aso_resultats, 'comparer');
|
373 |
jpm |
121 |
$pds_max = 0;
|
|
|
122 |
if (isset($aso_resultats[0]['poids'])) {
|
|
|
123 |
$pds_max = $aso_resultats[0]['poids'];
|
|
|
124 |
}
|
339 |
jpm |
125 |
for ($i = 0 ; $i < count($aso_resultats) ; $i++) {
|
368 |
jpm |
126 |
$aso_resultats[$i]['score'] = round((100 / $pds_max) * $aso_resultats[$i]['poids'], 1);
|
339 |
jpm |
127 |
}
|
|
|
128 |
|
217 |
jpm |
129 |
return $aso_resultats;
|
|
|
130 |
}
|
339 |
jpm |
131 |
|
846 |
jp_milcent |
132 |
/** Renvoie le nombre d'occurences total de la présence de chaque mot.
|
|
|
133 |
*
|
|
|
134 |
* @param string le motif à rechercher.
|
|
|
135 |
* @param string le texte dans lequel effectuer la recherche.
|
|
|
136 |
* @return integer le nombre de fois où les mots sont trouvés.
|
|
|
137 |
*/
|
851 |
jp_milcent |
138 |
function retournerOccurenceMotif($motif, &$texte, $mode = MORE_MODE)
|
846 |
jp_milcent |
139 |
{
|
|
|
140 |
$nbre_correspondance = 0;
|
1146 |
jp_milcent |
141 |
$nbre_correspondance_total = 0;
|
1183 |
jp_milcent |
142 |
$motif = $this->traiterMotif($motif, 'simple');
|
|
|
143 |
// Si demande de recherche d'expression complète
|
|
|
144 |
if (preg_match('/^".+"$/', $motif)) {
|
|
|
145 |
$mode = 2;
|
|
|
146 |
|
851 |
jp_milcent |
147 |
}
|
1183 |
jp_milcent |
148 |
$motif = $this->traiterMotif($motif, 'recherche');
|
|
|
149 |
switch ($mode) {
|
|
|
150 |
case '1' :
|
|
|
151 |
// Découpage en mot
|
|
|
152 |
$tab_motif = explode(' ', $motif);
|
|
|
153 |
break;
|
|
|
154 |
case '2' :
|
|
|
155 |
// La chaine saisie par l'utilisateur est recherchée tel quel
|
|
|
156 |
$tab_motif[] = $motif;
|
|
|
157 |
break;
|
|
|
158 |
default:
|
|
|
159 |
$e = 'Mode pour le moteur de recherche inconnu : '.$mode.
|
|
|
160 |
trigger_error($e, E_USER_ERROR);
|
|
|
161 |
}
|
846 |
jp_milcent |
162 |
// Nous recherchons chaque mot
|
1034 |
jp_milcent |
163 |
$compteur_mot = 0;
|
846 |
jp_milcent |
164 |
foreach ($tab_motif as $mot) {
|
|
|
165 |
//$nbre_correspondance += preg_match_all('/'.$mot.'/i', $texte, $tab_morceaux);
|
1964 |
aperonnet |
166 |
$nbre_correspondance = substr_count($this->eliminerAccents(strtolower($texte)), $this->eliminerAccents(strtolower($mot)));
|
1034 |
jp_milcent |
167 |
if ($nbre_correspondance > 0) {
|
|
|
168 |
$compteur_mot++;
|
|
|
169 |
}
|
|
|
170 |
$nbre_correspondance_total += $nbre_correspondance;
|
846 |
jp_milcent |
171 |
}
|
1034 |
jp_milcent |
172 |
// Si tous les mots recherchés sont présents nous renvoyons le poids de la page.
|
|
|
173 |
if ($compteur_mot == count($tab_motif)) {
|
|
|
174 |
return $nbre_correspondance_total;
|
|
|
175 |
} else {
|
|
|
176 |
return 0;
|
|
|
177 |
}
|
846 |
jp_milcent |
178 |
}
|
|
|
179 |
|
1183 |
jp_milcent |
180 |
function traiterMotif($motif, $type = 0)
|
1964 |
aperonnet |
181 |
{
|
1183 |
jp_milcent |
182 |
switch ($type) {
|
|
|
183 |
case 'simple' :
|
|
|
184 |
return trim(stripslashes($motif));
|
|
|
185 |
break;
|
|
|
186 |
case 'recherche' :
|
|
|
187 |
if (preg_match('/^"(.+)"$/', $motif, $match)) {
|
|
|
188 |
$motif = $match[1];
|
|
|
189 |
}
|
|
|
190 |
return $motif;
|
|
|
191 |
break;
|
|
|
192 |
case 'url' :
|
|
|
193 |
$motif = trim(stripslashes($motif));
|
|
|
194 |
if (preg_match('/^"(.+)"$/', $motif, $match)) {
|
|
|
195 |
$motif = $match[1];
|
|
|
196 |
}
|
|
|
197 |
return urlencode($motif);
|
|
|
198 |
break;
|
|
|
199 |
default:
|
|
|
200 |
return $motif;
|
|
|
201 |
}
|
|
|
202 |
}
|
|
|
203 |
|
339 |
jpm |
204 |
function traduireMois($mois_numerique)
|
|
|
205 |
{
|
|
|
206 |
switch ($mois_numerique) {
|
|
|
207 |
case '01' :
|
832 |
florian |
208 |
return 'janvier';
|
339 |
jpm |
209 |
case '02' :
|
832 |
florian |
210 |
return 'février';
|
339 |
jpm |
211 |
case '03' :
|
|
|
212 |
return 'mars';
|
|
|
213 |
case '04' :
|
|
|
214 |
return 'avril';
|
|
|
215 |
case '05' :
|
|
|
216 |
return 'mai';
|
|
|
217 |
case '06' :
|
|
|
218 |
return 'juin';
|
|
|
219 |
case '07' :
|
|
|
220 |
return 'juillet';
|
|
|
221 |
case '08' :
|
|
|
222 |
return 'août';
|
|
|
223 |
case '09' :
|
|
|
224 |
return 'septembre';
|
|
|
225 |
case '10' :
|
|
|
226 |
return 'octobre';
|
|
|
227 |
case '11' :
|
|
|
228 |
return 'novembre';
|
|
|
229 |
case '12' :
|
|
|
230 |
return 'décembre';
|
|
|
231 |
default:
|
|
|
232 |
return '';
|
|
|
233 |
}
|
|
|
234 |
}
|
1933 |
aperonnet |
235 |
|
|
|
236 |
/**
|
|
|
237 |
* Coupe un texte suivant une taille donnée, pour éviter qu'il ne soit
|
|
|
238 |
* trop long lors de l'affichage
|
|
|
239 |
* @param String texte à couper
|
|
|
240 |
* @param int taille maximum du texte
|
|
|
241 |
*/
|
|
|
242 |
function couperTexte($texte, $taille = 50)
|
|
|
243 |
{
|
|
|
244 |
$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
|
|
|
245 |
|
|
|
246 |
// on utilise les \r pour passer entre les gouttes
|
|
|
247 |
$texte = str_replace("\r\n", "\n", $texte);
|
|
|
248 |
$texte = str_replace("\r", "\n", $texte);
|
|
|
249 |
|
|
|
250 |
// sauts de ligne et paragraphes
|
|
|
251 |
$texte = ereg_replace("\n\n+", "\r", $texte);
|
|
|
252 |
$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
|
|
|
253 |
|
|
|
254 |
// supprimer les traits, lignes etc
|
|
|
255 |
$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
|
|
|
256 |
|
|
|
257 |
// supprimer les tags
|
|
|
258 |
$texte = $this->supprimerTags($texte);
|
|
|
259 |
$texte = trim(str_replace("\n"," ", $texte));
|
|
|
260 |
$texte .= "\n"; // marquer la fin
|
|
|
261 |
|
|
|
262 |
// travailler en accents charset
|
|
|
263 |
// On supprime dans Papyrus car cela tire trop de fonctions...
|
|
|
264 |
//$texte = $this->filtrer_entites($texte);
|
|
|
265 |
|
|
|
266 |
// supprimer les liens
|
|
|
267 |
$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
|
|
|
268 |
$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
|
|
|
269 |
|
|
|
270 |
// supprimer les notes
|
|
|
271 |
$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
|
|
|
272 |
|
|
|
273 |
// supprimer les codes typos
|
|
|
274 |
$texte = ereg_replace("[}{]", "", $texte);
|
|
|
275 |
|
|
|
276 |
// supprimer les tableaux
|
|
|
277 |
$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
|
|
|
278 |
|
|
|
279 |
// couper au mot precedent
|
|
|
280 |
$long = $this->gererSubstr($texte, 0, max($taille-4,1));
|
|
|
281 |
$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
|
|
|
282 |
$points = MORE_LG_RESULTAT_ETC;
|
|
|
283 |
|
|
|
284 |
// trop court ? ne pas faire de (...)
|
|
|
285 |
if (strlen($court) < max(0.75 * $taille,2)) {
|
|
|
286 |
$points = '';
|
|
|
287 |
$long = $this->gererSubstr($texte, 0, $taille);
|
|
|
288 |
$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
|
|
|
289 |
// encore trop court ? couper au caractere
|
|
|
290 |
if (strlen($texte) < 0.75 * $taille)
|
|
|
291 |
$texte = $long;
|
|
|
292 |
} else
|
|
|
293 |
$texte = $court;
|
|
|
294 |
|
|
|
295 |
if (strpos($texte, "\n")) // la fin est encore la : c'est qu'on n'a pas de texte de suite
|
|
|
296 |
$points = '';
|
|
|
297 |
|
|
|
298 |
// remettre les paragraphes
|
|
|
299 |
$texte = ereg_replace("\r+", "\n\n", $texte);
|
|
|
300 |
|
|
|
301 |
// supprimer l'eventuelle entite finale mal coupee
|
|
|
302 |
$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
|
|
|
303 |
|
|
|
304 |
return trim($texte).$points;
|
|
|
305 |
}
|
|
|
306 |
|
|
|
307 |
// Gerer les outils mb_string
|
|
|
308 |
// Fichier : inc_texte.php3
|
|
|
309 |
function gererSubstr($c, $start=0, $end='')
|
|
|
310 |
{
|
|
|
311 |
// methode substr normale
|
|
|
312 |
if ($end) {
|
|
|
313 |
return substr($c, $start, $end);
|
|
|
314 |
} else {
|
|
|
315 |
return substr($c, $start);
|
|
|
316 |
}
|
|
|
317 |
}
|
|
|
318 |
|
|
|
319 |
// Suppression basique et brutale de tous les <...>
|
|
|
320 |
// Fichier : inc_filtres.php3
|
|
|
321 |
function supprimerTags($texte, $rempl = "")
|
|
|
322 |
{
|
|
|
323 |
$texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
|
|
|
324 |
// ne pas oublier un < final non ferme
|
|
|
325 |
$texte = str_replace('<', ' ', $texte);
|
|
|
326 |
return $texte;
|
|
|
327 |
}
|
217 |
jpm |
328 |
}
|
|
|
329 |
|
|
|
330 |
/* +--Fin du code ----------------------------------------------------------------------------------------+
|
|
|
331 |
*
|
|
|
332 |
* $Log: not supported by cvs2svn $
|
1964 |
aperonnet |
333 |
* Revision 1.14 2008-10-21 16:54:18 aperonnet
|
|
|
334 |
* correction de bug de double inclusion de fichier quand une balise syndication est présente dans la page
|
|
|
335 |
*
|
1934 |
aperonnet |
336 |
* Revision 1.13 2008-10-21 15:24:50 aperonnet
|
|
|
337 |
* Ajout de résultats issus des fiches de bazar pour le moteur de recherche
|
|
|
338 |
*
|
1933 |
aperonnet |
339 |
* Revision 1.12 2007-10-29 18:29:30 jp_milcent
|
|
|
340 |
* Ajout d'un préfixe devant les classes de l'applette pour éviter les conflits avec d'autres classes provenant des applis clientes.
|
|
|
341 |
*
|
1678 |
jp_milcent |
342 |
* Revision 1.11 2007-01-02 18:49:22 jp_milcent
|
|
|
343 |
* Amélioration de la gestion du motif.
|
|
|
344 |
* Ajout de la gestion des expressions complête via l'utilisation de guillemets.
|
|
|
345 |
*
|
1183 |
jp_milcent |
346 |
* Revision 1.10 2006/12/12 13:54:41 jp_milcent
|
|
|
347 |
* Correction bogue : variable non initialisée.
|
|
|
348 |
*
|
1146 |
jp_milcent |
349 |
* Revision 1.9 2006/10/17 09:21:40 jp_milcent
|
|
|
350 |
* Mise en commun des spécifications de la recherche.
|
|
|
351 |
*
|
1034 |
jp_milcent |
352 |
* Revision 1.8 2006/05/23 14:18:19 jp_milcent
|
|
|
353 |
* Ajout de la gestion du mode de recherche au moteur de recherche de Papyrus.
|
|
|
354 |
* Soit on recherche chaque mot du motif, soit le motif entier.
|
|
|
355 |
*
|
851 |
jp_milcent |
356 |
* Revision 1.7 2006/05/19 10:04:55 jp_milcent
|
|
|
357 |
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
|
|
|
358 |
*
|
846 |
jp_milcent |
359 |
* Revision 1.6 2006/04/28 12:41:49 florian
|
|
|
360 |
* corrections erreurs chemin
|
|
|
361 |
*
|
832 |
florian |
362 |
* Revision 1.5 2005/09/20 17:01:22 ddelon
|
|
|
363 |
* php5 et bugs divers
|
|
|
364 |
*
|
443 |
ddelon |
365 |
* Revision 1.4 2005/05/25 13:49:22 jpm
|
|
|
366 |
* Corection erreur pour la recherche dans le contenu.
|
|
|
367 |
*
|
373 |
jpm |
368 |
* Revision 1.3 2005/05/19 12:46:12 jpm
|
|
|
369 |
* Correction bogue accesskey.
|
|
|
370 |
* Ajout d'un id à la liste.
|
|
|
371 |
* Arrondissement des score.
|
|
|
372 |
*
|
368 |
jpm |
373 |
* Revision 1.2 2005/04/14 17:39:34 jpm
|
|
|
374 |
* Amélioration du moteur de rechercher :
|
|
|
375 |
* - pourcentage
|
|
|
376 |
* - ajout d'info
|
|
|
377 |
*
|
339 |
jpm |
378 |
* Revision 1.1 2004/12/07 10:24:06 jpm
|
|
|
379 |
* Moteur de recherche version de départ.
|
|
|
380 |
*
|
217 |
jpm |
381 |
*
|
|
|
382 |
* +-- Fin du code ----------------------------------------------------------------------------------------+
|
|
|
383 |
*/
|
|
|
384 |
?>
|