Subversion Repositories Applications.papyrus

Rev

Rev 1049 | Rev 1183 | Go to most recent revision | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
846 jp_milcent 1
<?php
2
/*vim: set expandtab tabstop=4 shiftwidth=4: */
3
// +------------------------------------------------------------------------------------------------------+
4
// | PHP version 4.1                                                                                      |
5
// +------------------------------------------------------------------------------------------------------+
6
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org)                                         |
7
// +------------------------------------------------------------------------------------------------------+
8
// | This file is part of Papyrus.                                                                        |
9
// |                                                                                                      |
10
// | Foobar is free software; you can redistribute it and/or modify                                       |
11
// | it under the terms of the GNU General Public License as published by                                 |
12
// | the Free Software Foundation; either version 2 of the License, or                                    |
13
// | (at your option) any later version.                                                                  |
14
// |                                                                                                      |
15
// | Foobar is distributed in the hope that it will be useful,                                            |
16
// | but WITHOUT ANY WARRANTY; without even the implied warranty of                                       |
17
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the                                        |
18
// | GNU General Public License for more details.                                                         |
19
// |                                                                                                      |
20
// | You should have received a copy of the GNU General Public License                                    |
21
// | along with Foobar; if not, write to the Free Software                                                |
22
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA                            |
23
// +------------------------------------------------------------------------------------------------------+
24
// CVS : $Id$
25
/**
26
* Classe permettant d'effectuer des recherches sur les informations des articles de Spip.
27
*
28
* Permet de rechercher et classer les articles en fonction d'une chaine.
29
* Utilisation des bibliothèques inclue par Papyrus :
30
* - Papyrus pap_meta.fonct.php
31
* - Papyrus pap_menu.fonct.php
32
* - Papyrus pap_url.class.php
33
*
34
*@package Applette
35
*@subpackage Moteur_Recherche
36
//Auteur original :
37
*@author        Jean-Pascal MILCENT <jpm@tela-botanica.org>
38
//Autres auteurs :
39
*@author        aucun
40
*@copyright     Tela-Botanica 2000-2006
41
*@version       $Revision$ $Date$
42
// +------------------------------------------------------------------------------------------------------+
43
*/
44
 
45
// +------------------------------------------------------------------------------------------------------+
46
// |                                            ENTETE du PROGRAMME                                       |
47
// +------------------------------------------------------------------------------------------------------+
48
///** Inclusion du fichier contenant les fonctions de manipulations des menus de Papyrus.*/
49
//require_once GEN_CHEMIN_BIBLIO.'pap_menu.fonct.php';
50
 
51
// +------------------------------------------------------------------------------------------------------+
52
// |                                            CORPS du PROGRAMME                                        |
53
// +------------------------------------------------------------------------------------------------------+
54
 
55
class Recherche_Spip_Article extends Recherche {
56
 
57
    // Constructeur
58
    function Recherche_Menu_Meta($motif) {
59
        $this->setMotif($motif);
60
    }
61
 
62
    // Accesseurs
63
    function getMotif() {
64
        return $this->motif;
65
    }
66
    function setMotif($motif) {
67
        $this->motif = $motif;
68
    }
69
 
70
    // Méthodes
71
    function rechercherMotif($motif) {
72
    	for ($i = 0; $i < count($GLOBALS['_MOTEUR_RECHERCHE_']['spip']); $i++ ) {
73
	        $db = DB::connect($GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['bdd_dsn']);
74
	        if (DB::isError($db)) {
75
	    		$msg_erreur_connection = 'Impossible de se connecter à la base de données Spip.';
76
	    		die(BOG_afficherErreurSql(__FILE__, __LINE__, $db->getMessage(), 'connexion à la base de données',$msg_erreur_connection));
77
			}
78
	        $prefixe = $GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['table_prefixe'];
79
	        $url_base = $GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['url'];
80
	        $tab_articles = $this->retournerArticles($db, $prefixe);
81
	        foreach ($tab_articles as $article_id => $Article) {
82
	            // Initialisation du tableau de résultat vide
83
	            $aso_resultat = array(  'poids' => 0, 'url' => '', 'titre' => '',
84
	                                    'hreflang' => '', 'accesskey' => '', 'title' => '',
85
	                                    'date_creation' => '', 'description' => '');
86
 
87
	            // Analyse du poids de cette page vis à vis des données
1034 jp_milcent 88
	            $tab_champs_a_visiter = array('surtitre', 'titre', 'soustitre', 'descriptif', 'chapo', 'texte', 'ps');
846 jp_milcent 89
	            foreach ($tab_champs_a_visiter as $val) {
1034 jp_milcent 90
	                // Vérification que le champ existe et contient quelque chose
91
	                if (isset($Article->$val) && $Article->$val != '') {
92
						$aso_resultat['poids'] += $this->retournerOccurenceMotif($motif, $Article->$val);
1032 jp_milcent 93
	                }
846 jp_milcent 94
	            }
95
 
1034 jp_milcent 96
	            if ($aso_resultat['poids'] > 0) {
1032 jp_milcent 97
	                // Création de l'url
98
		            $var_recherche = str_replace(' ', '+', trim($motif));
1052 jp_milcent 99
		            $aso_resultat['url_simple'] = $url_base.'article'.$article_id.'.html';
100
		            $aso_resultat['url'] = $aso_resultat['url_simple'].'?var_recherche='.$var_recherche;
1032 jp_milcent 101
 
102
		            // Récupération du titre de la page
103
		            if (trim($Article->titre) != '') {
104
		                $aso_resultat['titre'] = htmlentities($Article->titre);
105
		            } else if (trim($Article->surtitre) != '') {
106
		                $aso_resultat['titre'] = htmlentities($Article->surtitre);
107
		            } else if (trim($Article->soustitre) != '') {
108
		                $aso_resultat['titre'] = htmlentities($Article->soustitre);
109
		            }
110
		            $aso_resultat['hreflang'] = htmlentities($Article->lang);
111
 
1049 jp_milcent 112
		            $aso_resultat['description'] = $this->couper($Article->texte, MORE_RESULTAT_TAILLE_DESCRIPTION);
1032 jp_milcent 113
 
114
		            if (($jour = date('d', strtotime($Article->date)) ) != 0 ) {
115
		                $aso_resultat['date_creation'] .= '<span class="page_modification_jour"> '.$jour.'</span>'."\n";
116
		            }
117
		            if (($mois = $this->traduireMois(date('m', strtotime($Article->date))) ) != '' ) {
118
		                $aso_resultat['date_creation'] .= '<span class="page_modification_mois"> '.$mois.'</span>'."\n";
119
		            }
120
		            if (($annee = date('Y', strtotime($Article->date)) ) != 0 ) {
121
		                $aso_resultat['date_creation'] .= '<span class="page_modification_annee"> '.$annee.'</span>'."\n";
122
		            }
846 jp_milcent 123
	                $this->setResultat($aso_resultat);
124
	            }
125
	        }
126
    	}
127
        return $this->getResultats();
128
    }
129
 
130
    /** Renvoie un tableau contenant les infos sur les articles
131
	*
132
	* @param  mixed		une instance de la classse Pear DB.
133
	* @param  string	le préfixe pour les tables spip.
134
	* @return array		tableau contenant les articles.
135
	*/
136
	function retournerArticles(&$db, $prefixe = '')
137
	{
138
	    //----------------------------------------------------------------------------
139
	    // Recherche des informations sur le menu
140
	    $requete =  'SELECT * '.
141
	                'FROM '.$prefixe.'spip_articles '.
142
	                'WHERE statut = "publie"';
143
 
144
	    $resultat = $db->query($requete);
145
	    (DB::isError($resultat)) ? die(BOG_afficherErreurSql(__FILE__, __LINE__, $resultat->getMessage(), $requete)) : '';
146
 
147
	    //----------------------------------------------------------------------------
148
	    // Récupération des infos
149
	    $tab_retour = array();
150
	    while ($info_article = $resultat->fetchRow(DB_FETCHMODE_OBJECT)) {
151
	        $tab_retour[$info_article->id_article] = $info_article;
152
	    }
153
	    $resultat->free();
154
 
155
	    return $tab_retour;
156
	}
157
 
158
	// Fichier : inc_texte.php3
159
	function couper($texte, $taille = 50)
160
	{
161
		$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
162
 
163
		// on utilise les \r pour passer entre les gouttes
164
		$texte = str_replace("\r\n", "\n", $texte);
165
		$texte = str_replace("\r", "\n", $texte);
166
 
167
		// sauts de ligne et paragraphes
168
		$texte = ereg_replace("\n\n+", "\r", $texte);
169
		$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
170
 
171
		// supprimer les traits, lignes etc
172
		$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
173
 
174
		// supprimer les tags
175
		$texte = $this->supprimer_tags($texte);
176
		$texte = trim(str_replace("\n"," ", $texte));
177
		$texte .= "\n";	// marquer la fin
178
 
179
		// travailler en accents charset
180
		// On supprime dans Papyrus car cela tire trop de fonctions...
181
		//$texte = $this->filtrer_entites($texte);
182
 
183
		// supprimer les liens
184
		$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
185
		$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
186
 
187
		// supprimer les notes
188
		$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
189
 
190
		// supprimer les codes typos
191
		$texte = ereg_replace("[}{]", "", $texte);
192
 
193
		// supprimer les tableaux
194
		$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
195
 
196
		// couper au mot precedent
197
		$long = $this->spip_substr($texte, 0, max($taille-4,1));
198
		$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
1049 jp_milcent 199
		$points = MORE_LG_RESULTAT_ETC;
846 jp_milcent 200
 
201
		// trop court ? ne pas faire de (...)
202
		if (strlen($court) < max(0.75 * $taille,2)) {
203
			$points = '';
204
			$long = $this->spip_substr($texte, 0, $taille);
205
			$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
206
			// encore trop court ? couper au caractere
207
			if (strlen($texte) < 0.75 * $taille)
208
				$texte = $long;
209
		} else
210
			$texte = $court;
211
 
212
		if (strpos($texte, "\n"))	// la fin est encore la : c'est qu'on n'a pas de texte de suite
213
			$points = '';
214
 
215
		// remettre les paragraphes
216
		$texte = ereg_replace("\r+", "\n\n", $texte);
217
 
218
		// supprimer l'eventuelle entite finale mal coupee
219
		$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
220
 
221
		return trim($texte).$points;
222
	}
223
 
224
	// Gerer les outils mb_string
225
	// Fichier : inc_texte.php3
226
	function spip_substr($c, $start=0, $end='')
227
	{
228
		// methode substr normale
229
		if ($end) {
230
			return substr($c, $start, $end);
231
		} else {
232
			return substr($c, $start);
233
		}
234
	}
235
 
236
	// Suppression basique et brutale de tous les <...>
237
	// Fichier : inc_filtres.php3
238
	function supprimer_tags($texte, $rempl = "")
239
	{
240
		$texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
241
		// ne pas oublier un < final non ferme
242
		$texte = str_replace('<', ' ', $texte);
243
		return $texte;
244
	}
245
 
246
}
247
 
248
/* +--Fin du code ----------------------------------------------------------------------------------------+
249
*
250
* $Log$
1052 jp_milcent 251
* Revision 1.4  2006/11/14 16:08:40  jp_milcent
252
* Paramétrage de la découpe de la description et du symbole "etc"
253
*
1049 jp_milcent 254
* Revision 1.3  2006/10/17 09:21:40  jp_milcent
255
* Mise en commun des spécifications de la recherche.
256
*
1034 jp_milcent 257
* Revision 1.2  2006/10/16 14:11:30  jp_milcent
258
* Amélioration du moteur de recherche.
259
* Utilisation de l'opérateur "et" entre les mots recherchés.
260
*
1032 jp_milcent 261
* Revision 1.1  2006/05/19 10:04:55  jp_milcent
262
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
263
*
846 jp_milcent 264
*
265
* +-- Fin du code ----------------------------------------------------------------------------------------+
266
*/
267
?>