Subversion Repositories eFlore/Applications.cel

Rev

Rev 2459 | Rev 2959 | Go to most recent revision | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
1425 aurelien 1
<?php
2462 jpm 2
// declare(encoding='UTF-8');
1425 aurelien 3
/**
2462 jpm 4
 * Classe recherchant des infos sur un taxon.
1926 raphael 5
 *
2462 jpm 6
 * Elle appelle les web service d'eflore pour éviter que le code client ne soit dépendant de la BDD d'eFlore.
2152 jpm 7
 *
2462 jpm 8
 * @internal   Mininum PHP version : 5.2
9
 * @category   CEL
10
 * @package    Services
11
 * @subpackage Bibliothèques
12
 * @version    0.1
13
 * @author     Mathias CHOUET <mathias@tela-botanica.org>
14
 * @author     Jean-Pascal MILCENT <jpm@tela-botanica.org>
15
 * @author     Aurelien PERONNET <aurelien@tela-botanica.org>
16
 * @license    GPL v3 <http://www.gnu.org/licenses/gpl.txt>
17
 * @license    CECILL v2 <http://www.cecill.info/licences/Licence_CeCILL_V2-en.txt>
18
 * @copyright  1999-2014 Tela Botanica <accueil@tela-botanica.org>
1425 aurelien 19
 */
20
class RechercheInfosTaxonBeta extends Cel {
1926 raphael 21
 
22
	const DEBUG = FALSE;
23
 
1427 aurelien 24
	private $url_service_nom = null;
25
	private $url_service_taxon = null;
26
	private $url_service_chorologie = null;
2152 jpm 27
 
1487 aurelien 28
	private $masque_recherche = null;
1527 aurelien 29
	private $code_referentiel = 'bdtfx';
1784 raphael 30
 
31
	// initialisé à TRUE par rechercherInfosSurTexteCodeOuNumTax()
32
	// si l'espèce passée a le motif <ref>:(nt|nn):<num>, eg: isfan:nt:1591
33
	public $is_notation_spe = FALSE;
34
 
2462 jpm 35
	// un cache utilisé pour les requêtes effectuées sur /service:eflore:0.1/bdtfx/noms?masque=
36
	// qui sont lourdes, et parfois identiques (cf cas de l'import XLS)
37
	static $cache = array();
1928 raphael 38
 
1527 aurelien 39
	public function RechercheInfosTaxonBeta($config, $code_referentiel = 'bdtfx') {
40
		parent::__construct($config);
2462 jpm 41
		$this->setReferentiel($code_referentiel);
42
	}
1927 raphael 43
 
2462 jpm 44
	public function setReferentiel($code_referentiel = 'bdtfx') {
1527 aurelien 45
		$this->code_referentiel = $code_referentiel;
1927 raphael 46
		$this->formaterUrlsServices($this->config);
1527 aurelien 47
	}
2152 jpm 48
 
1527 aurelien 49
	private function formaterUrlsServices($config) {
50
		$this->url_service_nom = str_replace('{referentiel}', $this->code_referentiel ,$config['eflore']['url_service_nom']);
51
		$this->url_service_taxon = str_replace('{referentiel}', $this->code_referentiel ,$config['eflore']['url_service_taxon']);
1427 aurelien 52
		$this->url_service_chorologie_obs = $config['eflore']['url_service_chorologie_obs'];
1852 raphael 53
		$this->config = $config;
1425 aurelien 54
	}
2152 jpm 55
 
1425 aurelien 56
	public function rechercherGenreEspeceSurPrefixe($genre = null, $espece = null) {
2152 jpm 57
		$liste_genre_espece = array();
1487 aurelien 58
		$this->masque_recherche = trim(trim($genre).' '.trim($espece,' *'));
59
		$masque = urlencode($this->masque_recherche);
1926 raphael 60
		if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'?masque='.$masque.'&recherche=etendue&retour.format=min&navigation.limite=50&ns.structure=au');
2123 mathias 61
		$urlService = $this->url_service_nom.'?masque='.$masque.'&recherche=etendue&retour.format=min&navigation.limite=50&ns.structure=au';
62
		$requete = @file_get_contents($urlService);
1425 aurelien 63
		if($requete != '') {
2152 jpm 64
			$requete = json_decode($requete);
1425 aurelien 65
			if(is_object($requete) && isset($requete->resultat)) {
66
				foreach ($requete->resultat as $id => $res) {
1427 aurelien 67
					$retenu = ($res->retenu == "true") ? '3' : '4';
2243 mathias 68
					$liste_genre_espece[] = array($res->nom_sci_complet, $id, $retenu, $res->nom_sci);
1425 aurelien 69
				}
70
			}
2152 jpm 71
			usort($liste_genre_espece, array($this, 'comparerParRetenuPuisNom'));
1425 aurelien 72
		}
73
		return $liste_genre_espece;
74
	}
2152 jpm 75
 
1427 aurelien 76
	function comparerParRetenuPuisNom($a, $b) {
77
		if($a[2] == 3 && $b[2] != 3) {
78
			return -1;
79
		} elseif($a[2] != 3 && $b[2] == 3) {
80
			return 1;
81
		} else {
2243 mathias 82
			// maintient l'ordre lexicographique - et normalement le genre en premier, en utilisant le nom_sci (sans auteur)
83
			return strcasecmp($a[3], $b[3]);
84
			// @WTF levenshtein c'était juste pour garder le genre en premier ?
85
			//return levenshtein($this->masque_recherche, $a[0]) >= levenshtein($this->masque_recherche, $b[0]);
1427 aurelien 86
		}
1425 aurelien 87
	}
2152 jpm 88
 
1425 aurelien 89
	public function effectuerRequeteInfosComplementairesEtFormaterNom($numNom) {
90
		$resultat_infos_complementaires = (array)$this->effectuerRequeteInfosComplementairesSurNumNom($numNom);
91
		$retour_infos_complementaires = array();
1780 raphael 92
		if (isset($resultat_infos_complementaires['nom_retenu_complet']) && $resultat_infos_complementaires['nom_retenu_complet']) {
1926 raphael 93
			$retour_infos_complementaires=array((self::supprimerBiblio($resultat_infos_complementaires['nom_retenu_complet'])));
94
		}
2152 jpm 95
 
1425 aurelien 96
		return $retour_infos_complementaires;
97
	}
2152 jpm 98
 
1425 aurelien 99
	public function rechercherInformationsComplementairesSurNom($nom_saisi) {
1487 aurelien 100
		$nom_saisi = trim($nom_saisi);
1486 aurelien 101
		// Essai de recherche sur le nom saisi tel quel
1862 raphael 102
		$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'stricte');
103
		if($liste_genre_espece) return $liste_genre_espece;
104
 
105
		// Essai de recherche stricte en tentant de supprimer le nom d'auteur
106
		if( ($nom_saisi_sans_auteur = self::supprimerAuteur($nom_saisi)) ) { // ne pas faire la requête sur un mot vide
107
			$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi_sans_auteur, 'stricte');
1486 aurelien 108
		}
1862 raphael 109
		if($liste_genre_espece) return $liste_genre_espece;
110
 
111
		// avant-dernière tentative : essai de recherche étendue
112
		$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'etendue');
113
		if($liste_genre_espece) return $liste_genre_espece;
114
 
115
		// dernière tentative: concaténation (nom_sci,auteur) (= nom-retenu généré utilisé comme nom_sci)
116
		$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'concat');
2152 jpm 117
 
1486 aurelien 118
		return $liste_genre_espece;
119
	}
2152 jpm 120
 
1862 raphael 121
	private function effectuerRequeteUrlRecherche($nom_saisi, $mode = 'stricte') {
2462 jpm 122
		$url = sprintf(
123
			'%1$s?masque=%2$s&recherche=%3$s&ns.format=txt&retour.champs=%4$s&navigation.limite=1',
124
			$this->url_service_nom,
125
			urlencode($nom_saisi),
126
			$mode,
127
			implode(',', array("id","nom_sci","auteur","nom_retenu.id","famille","num_taxonomique","nom_retenu_complet")));
1928 raphael 128
 
129
		if(! array_key_exists($url, self::$cache)) {
2462 jpm 130
			if(self::DEBUG) error_log("CEL fetch: " . $url);
131
			$res = @json_decode(file_get_contents($url));
132
			self::$cache[$url] = $res;
133
		} else {
134
			$res = self::$cache[$url];
135
		}
1780 raphael 136
		if(!$res) return NULL;
137
		$resultat = (array)$res->resultat;
138
		return array_pop($resultat);
1486 aurelien 139
	}
2152 jpm 140
 
1833 raphael 141
	static function supprimerAuteur($nom_saisi) {
1486 aurelien 142
		// TODO: gérer les hybrides
1833 raphael 143
		if(self::estUnHybride($nom_saisi) || self::estUneFormuleHybridite($nom_saisi)) {
1486 aurelien 144
			$nom_decoupe = explode(' ', $nom_saisi);
1930 raphael 145
			$derniere_position_hybride = array_keys($nom_decoupe, 'x');
146
			$nom_saisi_sans_auteur = implode(' ',array_slice($nom_decoupe, 0, end($derniere_position_hybride) + 2));
1486 aurelien 147
		} else {
1833 raphael 148
			/* Attention le parseur de nom n'est pas fiable à 100%
2152 jpm 149
			   mais ça marche dans la plupart des cas
1833 raphael 150
			   à part les formules d'hybridité saisies avec un auteur */
151
			$nameparser = new NameParser();
1486 aurelien 152
			$auteur = $nameparser->parse_auth($nom_saisi);
153
			$nom_saisi_sans_auteur = str_replace($auteur, '', $nom_saisi);
154
		}
155
 
1833 raphael 156
		return trim($nom_saisi_sans_auteur);
1486 aurelien 157
	}
2152 jpm 158
 
1833 raphael 159
	static function estUneFormuleHybridite($nom_saisi) {
1486 aurelien 160
		return strpos($nom_saisi,' x ') !== false;
161
	}
2152 jpm 162
 
1833 raphael 163
	static function estUnHybride($nom_saisi) {
1486 aurelien 164
		return strpos($nom_saisi,'x ') === 0;
165
	}
2152 jpm 166
 
1852 raphael 167
	public function effectuerRequeteInfosComplementairesSurNumNom($num_nom, $ref = NULL) {
168
		if($ref && isset($this->config['eflore']['api_host'])) {
1926 raphael 169
			if(self::DEBUG) error_log("CEL fetch: " .$this->config['eflore']['api_host'] . '/');
1852 raphael 170
			return @json_decode(file_get_contents($this->config['eflore']['api_host'] . '/' .
1926 raphael 171
			$ref . '/' .
172
			'noms' . '/' .
173
			$num_nom .
174
			'?retour.champs=' . implode(',', array('nom_sci,auteur',
175
			'id',
176
			'nom_retenu_complet',
177
			'nom_retenu.id',
178
			'num_taxonomique',
179
			'famille'))));
1852 raphael 180
		}
181
		// XXX: compat
1926 raphael 182
		if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'/'.$num_nom.'?retour.champs=nom_sci,auteur,id,nom_retenu_complet,nom_retenu.id,num_taxonomique,famille');
1780 raphael 183
		return @json_decode(file_get_contents($this->url_service_nom.'/'.$num_nom.'?retour.champs=nom_sci,auteur,id,nom_retenu_complet,nom_retenu.id,num_taxonomique,famille'));
1425 aurelien 184
	}
1780 raphael 185
 
186
	static function supprimerBiblio($nom) {
1805 raphael 187
		return trim(preg_replace('/ \[.*\]/','',$nom));
1425 aurelien 188
	}
2152 jpm 189
 
1425 aurelien 190
	public function rechercherNumTaxSurNumNom($num_nom) {
191
		$nt = null;
1427 aurelien 192
		$url = $this->url_service_nom."/".$num_nom.'?retour.champs=num_taxonomique';
1926 raphael 193
		if(self::DEBUG) error_log("CEL fetch: $url");
1425 aurelien 194
		$resultat = @file_get_contents($url);
195
		if($resultat != '') {
196
			$infos = json_decode($resultat);
197
			$nt = $infos->num_taxonomique;
198
		}
2152 jpm 199
 
1425 aurelien 200
		return $nt;
201
	}
2152 jpm 202
 
1425 aurelien 203
	public function taxonEstPresentDansDepartement($num_taxon,$code_departement) {
204
		$presence_taxon = false;
1427 aurelien 205
		$url = $this->url_service_chorologie_obs.'?masque.departement='.$code_departement.'&masque.determination.nt='.$num_taxon.'&navigation.limite=1';
1926 raphael 206
		if(self::DEBUG) error_log("CEL fetch: $url");
1425 aurelien 207
		$resultat = @file_get_contents($url);
208
		if($resultat != '') {
209
			$resultat = json_decode($resultat);
210
			if(is_object($resultat) && isset($resultat->resultat) && count($resultat->resultat) > 0) {
211
				$presence_taxon = true;
212
			}
213
		}
214
		return $presence_taxon;
215
	}
2152 jpm 216
 
217
	/* texte libre, nom scientifique,
218
	   ou code nomenclatural (format bdtfx:nn:999999)
1784 raphael 219
	   ou code taxonomique (format bdtfx:nt:999999)
1780 raphael 220
	   TODO: voir ce qu'on fait pour l'import de différent référentiels */
1425 aurelien 221
	function rechercherInfosSurTexteCodeOuNumTax($identifiant_espece) {
1784 raphael 222
		preg_match('/(' . implode('|', Cel::$referentiels_valides) .'):(nn|nt):(\d+)/i', $identifiant_espece, $elements);
223
		if($elements) {
224
			$this->is_notation_spe = TRUE;
225
			list(, $ref, $type, $num) = $elements;
1796 raphael 226
 
227
			if($ref != $this->code_referentiel) {
228
				// TODO: ignorer la colonne référentiel, et utiliser le référentiel donné
229
				// mais il faut alors avertir le service (d'import/modif) d'utiliser le référentiel
230
				// passé au nom d'espèce
1852 raphael 231
				// Seul le effectuerRequeteInfosComplementairesSurNumNom() le supporte, car c'est encore
232
				// un peu complexe à implémenter proprement pour cause d'attributs de classes.
1796 raphael 233
			}
1784 raphael 234
			// Numero nomenclatural
235
			if ($type == 'nn') {
1852 raphael 236
				$obj = $this->effectuerRequeteInfosComplementairesSurNumNom($num, $ref);
1784 raphael 237
			}
238
			// Numero taxonomique
239
			else {
240
				//TODO: retourner moins de champs grâce au paramètre retour.champs
1926 raphael 241
				if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_taxon."/nt:".$num);
1784 raphael 242
				$obj = @json_decode(file_get_contents($this->url_service_taxon."/nt:".$num));
243
			}
1796 raphael 244
			if($obj) $obj->ref = $ref;
1784 raphael 245
			return $obj;
246
		}
1746 raphael 247
 
1780 raphael 248
		// Nom scientifique
249
		return $this->rechercherInformationsComplementairesSurNom($identifiant_espece);
1425 aurelien 250
	}
2152 jpm 251
 
1591 aurelien 252
	public function rechercherSynonymesSurNumNom($num_nom) {
253
		$retour = array();
1926 raphael 254
		if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'/'.$num_nom.'/relations/synonymie/?retour.format=min');
1780 raphael 255
		$resultat = @file_get_contents($this->url_service_nom.'/'.$num_nom.'/relations/synonymie/?retour.format=min');
1591 aurelien 256
		if($resultat != '') {
257
			$resultat = json_decode($resultat);
258
			if(is_object($resultat) && isset($resultat->resultat) && count($resultat->resultat) > 0) {
259
				$retour = $resultat->resultat;
260
			}
261
		}
262
		return $retour;
263
	}
2152 jpm 264
}