Subversion Repositories Applications.papyrus

Rev

Rev 1372 | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
846 jp_milcent 1
<?php
2
/*vim: set expandtab tabstop=4 shiftwidth=4: */
3
// +------------------------------------------------------------------------------------------------------+
4
// | PHP version 4.1                                                                                      |
5
// +------------------------------------------------------------------------------------------------------+
6
// | Copyright (C) 2004 Tela Botanica (accueil@tela-botanica.org)                                         |
7
// +------------------------------------------------------------------------------------------------------+
8
// | This file is part of Papyrus.                                                                        |
9
// |                                                                                                      |
10
// | Foobar is free software; you can redistribute it and/or modify                                       |
11
// | it under the terms of the GNU General Public License as published by                                 |
12
// | the Free Software Foundation; either version 2 of the License, or                                    |
13
// | (at your option) any later version.                                                                  |
14
// |                                                                                                      |
15
// | Foobar is distributed in the hope that it will be useful,                                            |
16
// | but WITHOUT ANY WARRANTY; without even the implied warranty of                                       |
17
// | MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the                                        |
18
// | GNU General Public License for more details.                                                         |
19
// |                                                                                                      |
20
// | You should have received a copy of the GNU General Public License                                    |
21
// | along with Foobar; if not, write to the Free Software                                                |
22
// | Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA                            |
23
// +------------------------------------------------------------------------------------------------------+
24
// CVS : $Id$
25
/**
26
* Classe permettant d'effectuer des recherches sur les informations des articles de Spip.
27
*
28
* Permet de rechercher et classer les articles en fonction d'une chaine.
29
* Utilisation des bibliothèques inclue par Papyrus :
30
* - Papyrus pap_meta.fonct.php
31
* - Papyrus pap_menu.fonct.php
32
* - Papyrus pap_url.class.php
33
*
34
*@package Applette
35
*@subpackage Moteur_Recherche
36
//Auteur original :
37
*@author        Jean-Pascal MILCENT <jpm@tela-botanica.org>
38
//Autres auteurs :
39
*@author        aucun
40
*@copyright     Tela-Botanica 2000-2006
41
*@version       $Revision$ $Date$
42
// +------------------------------------------------------------------------------------------------------+
43
*/
44
 
45
// +------------------------------------------------------------------------------------------------------+
46
// |                                            ENTETE du PROGRAMME                                       |
47
// +------------------------------------------------------------------------------------------------------+
48
///** Inclusion du fichier contenant les fonctions de manipulations des menus de Papyrus.*/
49
//require_once GEN_CHEMIN_BIBLIO.'pap_menu.fonct.php';
50
 
51
// +------------------------------------------------------------------------------------------------------+
52
// |                                            CORPS du PROGRAMME                                        |
53
// +------------------------------------------------------------------------------------------------------+
54
 
55
class Recherche_Spip_Article extends Recherche {
56
 
57
    // Constructeur
58
    function Recherche_Menu_Meta($motif) {
59
        $this->setMotif($motif);
60
    }
61
 
62
    // Accesseurs
63
    function getMotif() {
64
        return $this->motif;
65
    }
66
    function setMotif($motif) {
67
        $this->motif = $motif;
68
    }
69
 
70
    // Méthodes
71
    function rechercherMotif($motif) {
72
    	for ($i = 0; $i < count($GLOBALS['_MOTEUR_RECHERCHE_']['spip']); $i++ ) {
73
	        $db = DB::connect($GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['bdd_dsn']);
74
	        if (DB::isError($db)) {
75
	    		$msg_erreur_connection = 'Impossible de se connecter à la base de données Spip.';
76
	    		die(BOG_afficherErreurSql(__FILE__, __LINE__, $db->getMessage(), 'connexion à la base de données',$msg_erreur_connection));
77
			}
78
	        $prefixe = $GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['table_prefixe'];
79
	        $url_base = $GLOBALS['_MOTEUR_RECHERCHE_']['spip'][$i]['url'];
80
	        $tab_articles = $this->retournerArticles($db, $prefixe);
81
	        foreach ($tab_articles as $article_id => $Article) {
82
	            // Initialisation du tableau de résultat vide
83
	            $aso_resultat = array(  'poids' => 0, 'url' => '', 'titre' => '',
84
	                                    'hreflang' => '', 'accesskey' => '', 'title' => '',
85
	                                    'date_creation' => '', 'description' => '');
86
 
87
	            // Analyse du poids de cette page vis à vis des données
1034 jp_milcent 88
	            $tab_champs_a_visiter = array('surtitre', 'titre', 'soustitre', 'descriptif', 'chapo', 'texte', 'ps');
846 jp_milcent 89
	            foreach ($tab_champs_a_visiter as $val) {
1034 jp_milcent 90
	                // Vérification que le champ existe et contient quelque chose
91
	                if (isset($Article->$val) && $Article->$val != '') {
92
						$aso_resultat['poids'] += $this->retournerOccurenceMotif($motif, $Article->$val);
1032 jp_milcent 93
	                }
846 jp_milcent 94
	            }
95
 
1034 jp_milcent 96
	            if ($aso_resultat['poids'] > 0) {
1032 jp_milcent 97
	                // Création de l'url
1052 jp_milcent 98
		            $aso_resultat['url_simple'] = $url_base.'article'.$article_id.'.html';
1183 jp_milcent 99
		            $aso_resultat['url'] = $aso_resultat['url_simple'].'?var_recherche='.$this->traiterMotif($motif, 'url');
1032 jp_milcent 100
 
101
		            // Récupération du titre de la page
102
		            if (trim($Article->titre) != '') {
103
		                $aso_resultat['titre'] = htmlentities($Article->titre);
104
		            } else if (trim($Article->surtitre) != '') {
105
		                $aso_resultat['titre'] = htmlentities($Article->surtitre);
106
		            } else if (trim($Article->soustitre) != '') {
107
		                $aso_resultat['titre'] = htmlentities($Article->soustitre);
108
		            }
109
		            $aso_resultat['hreflang'] = htmlentities($Article->lang);
110
 
1049 jp_milcent 111
		            $aso_resultat['description'] = $this->couper($Article->texte, MORE_RESULTAT_TAILLE_DESCRIPTION);
1032 jp_milcent 112
 
113
		            if (($jour = date('d', strtotime($Article->date)) ) != 0 ) {
114
		                $aso_resultat['date_creation'] .= '<span class="page_modification_jour"> '.$jour.'</span>'."\n";
115
		            }
116
		            if (($mois = $this->traduireMois(date('m', strtotime($Article->date))) ) != '' ) {
117
		                $aso_resultat['date_creation'] .= '<span class="page_modification_mois"> '.$mois.'</span>'."\n";
118
		            }
119
		            if (($annee = date('Y', strtotime($Article->date)) ) != 0 ) {
120
		                $aso_resultat['date_creation'] .= '<span class="page_modification_annee"> '.$annee.'</span>'."\n";
121
		            }
846 jp_milcent 122
	                $this->setResultat($aso_resultat);
123
	            }
124
	        }
125
    	}
126
        return $this->getResultats();
127
    }
128
 
129
    /** Renvoie un tableau contenant les infos sur les articles
130
	*
131
	* @param  mixed		une instance de la classse Pear DB.
132
	* @param  string	le préfixe pour les tables spip.
133
	* @return array		tableau contenant les articles.
134
	*/
135
	function retournerArticles(&$db, $prefixe = '')
136
	{
137
	    //----------------------------------------------------------------------------
138
	    // Recherche des informations sur le menu
139
	    $requete =  'SELECT * '.
140
	                'FROM '.$prefixe.'spip_articles '.
141
	                'WHERE statut = "publie"';
142
 
143
	    $resultat = $db->query($requete);
144
	    (DB::isError($resultat)) ? die(BOG_afficherErreurSql(__FILE__, __LINE__, $resultat->getMessage(), $requete)) : '';
145
 
146
	    //----------------------------------------------------------------------------
147
	    // Récupération des infos
148
	    $tab_retour = array();
149
	    while ($info_article = $resultat->fetchRow(DB_FETCHMODE_OBJECT)) {
150
	        $tab_retour[$info_article->id_article] = $info_article;
151
	    }
152
	    $resultat->free();
153
 
154
	    return $tab_retour;
155
	}
156
 
157
	// Fichier : inc_texte.php3
158
	function couper($texte, $taille = 50)
159
	{
160
		$texte = substr($texte, 0, 400 + 2*$taille); /* eviter de travailler sur 10ko pour extraire 150 caracteres */
161
 
162
		// on utilise les \r pour passer entre les gouttes
163
		$texte = str_replace("\r\n", "\n", $texte);
164
		$texte = str_replace("\r", "\n", $texte);
165
 
166
		// sauts de ligne et paragraphes
167
		$texte = ereg_replace("\n\n+", "\r", $texte);
168
		$texte = ereg_replace("<(p|br)( [^>]*)?".">", "\r", $texte);
169
 
170
		// supprimer les traits, lignes etc
171
		$texte = ereg_replace("(^|\r|\n)(-[-#\*]*|_ )", "\r", $texte);
172
 
173
		// supprimer les tags
174
		$texte = $this->supprimer_tags($texte);
175
		$texte = trim(str_replace("\n"," ", $texte));
176
		$texte .= "\n";	// marquer la fin
177
 
178
		// travailler en accents charset
179
		// On supprime dans Papyrus car cela tire trop de fonctions...
180
		//$texte = $this->filtrer_entites($texte);
181
 
182
		// supprimer les liens
183
		$texte = ereg_replace("\[->([^]]*)\]","\\1", $texte); // liens sans texte
184
		$texte = ereg_replace("\[([^\[]*)->([^]]*)\]","\\1", $texte);
185
 
186
		// supprimer les notes
187
		$texte = ereg_replace("\[\[([^]]|\][^]])*\]\]", "", $texte);
188
 
189
		// supprimer les codes typos
190
		$texte = ereg_replace("[}{]", "", $texte);
191
 
192
		// supprimer les tableaux
193
		$texte = ereg_replace("(^|\r)\|.*\|\r", "\r", $texte);
194
 
195
		// couper au mot precedent
196
		$long = $this->spip_substr($texte, 0, max($taille-4,1));
197
		$court = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*\n?$", "\\1", $long);
1049 jp_milcent 198
		$points = MORE_LG_RESULTAT_ETC;
846 jp_milcent 199
 
200
		// trop court ? ne pas faire de (...)
201
		if (strlen($court) < max(0.75 * $taille,2)) {
202
			$points = '';
203
			$long = $this->spip_substr($texte, 0, $taille);
204
			$texte = ereg_replace("([^[:space:]][[:space:]]+)[^[:space:]]*$", "\\1", $long);
205
			// encore trop court ? couper au caractere
206
			if (strlen($texte) < 0.75 * $taille)
207
				$texte = $long;
208
		} else
209
			$texte = $court;
210
 
211
		if (strpos($texte, "\n"))	// la fin est encore la : c'est qu'on n'a pas de texte de suite
212
			$points = '';
213
 
214
		// remettre les paragraphes
215
		$texte = ereg_replace("\r+", "\n\n", $texte);
216
 
217
		// supprimer l'eventuelle entite finale mal coupee
218
		$texte = preg_replace('/&#?[a-z0-9]*$/', '', $texte);
219
 
220
		return trim($texte).$points;
221
	}
222
 
223
	// Gerer les outils mb_string
224
	// Fichier : inc_texte.php3
225
	function spip_substr($c, $start=0, $end='')
226
	{
227
		// methode substr normale
228
		if ($end) {
229
			return substr($c, $start, $end);
230
		} else {
231
			return substr($c, $start);
232
		}
233
	}
234
 
235
	// Suppression basique et brutale de tous les <...>
236
	// Fichier : inc_filtres.php3
237
	function supprimer_tags($texte, $rempl = "")
238
	{
239
		$texte = preg_replace(",<[^>]*>,U", $rempl, $texte);
240
		// ne pas oublier un < final non ferme
241
		$texte = str_replace('<', ' ', $texte);
242
		return $texte;
243
	}
244
 
245
}
246
 
247
/* +--Fin du code ----------------------------------------------------------------------------------------+
248
*
249
* $Log$
1183 jp_milcent 250
* Revision 1.5  2006/11/20 09:36:59  jp_milcent
251
* Correction bogue zéro résultat et ajout d'url simple pour indiquer la page de l'article.
252
*
1052 jp_milcent 253
* Revision 1.4  2006/11/14 16:08:40  jp_milcent
254
* Paramétrage de la découpe de la description et du symbole "etc"
255
*
1049 jp_milcent 256
* Revision 1.3  2006/10/17 09:21:40  jp_milcent
257
* Mise en commun des spécifications de la recherche.
258
*
1034 jp_milcent 259
* Revision 1.2  2006/10/16 14:11:30  jp_milcent
260
* Amélioration du moteur de recherche.
261
* Utilisation de l'opérateur "et" entre les mots recherchés.
262
*
1032 jp_milcent 263
* Revision 1.1  2006/05/19 10:04:55  jp_milcent
264
* Ajout d'un moteur de recherche analysant les articles des sites sous Spip.
265
*
846 jp_milcent 266
*
267
* +-- Fin du code ----------------------------------------------------------------------------------------+
268
*/
269
?>