| 1425 | aurelien | 1 | <?php
 | 
        
           |  |  | 2 | /**
 | 
        
           | 1926 | raphael | 3 |  * PHP Version 5
 | 
        
           |  |  | 4 |  *
 | 
        
           |  |  | 5 |  * @category  PHP
 | 
        
           |  |  | 6 |  * @package	  jrest
 | 
        
           |  |  | 7 |  * @author	  David Delon <david@tela-botania.org>
 | 
        
           |  |  | 8 |  * @author	  Aurélien Peronnet <aurelien@tela-botania.org>
 | 
        
           |  |  | 9 |  * @copyright 2010 Tela-Botanica
 | 
        
           |  |  | 10 |  * @license	  http://www.cecill.info/licences/Licence_CeCILL_V2-fr.txt Licence CECILL
 | 
        
           |  |  | 11 |  * @version	  SVN: <svn_id>
 | 
        
           |  |  | 12 |  * @link	  /doc/jrest/
 | 
        
           |  |  | 13 |  */
 | 
        
           | 1425 | aurelien | 14 |   | 
        
           |  |  | 15 | /**
 | 
        
           | 2152 | jpm | 16 |  *
 | 
        
           |  |  | 17 |  * La classe appelle les web service d'eflore pour éviter que le code client
 | 
        
           | 1425 | aurelien | 18 |  * ne soit dépendant de la version d'eflore
 | 
        
           |  |  | 19 |  */
 | 
        
           |  |  | 20 | class RechercheInfosTaxonBeta extends Cel {
 | 
        
           | 1926 | raphael | 21 |   | 
        
           |  |  | 22 | 	const DEBUG = FALSE;
 | 
        
           |  |  | 23 |   | 
        
           | 1427 | aurelien | 24 | 	private $url_service_nom = null;
 | 
        
           |  |  | 25 | 	private $url_service_taxon = null;
 | 
        
           |  |  | 26 | 	private $url_service_chorologie = null;
 | 
        
           | 2152 | jpm | 27 |   | 
        
           | 1487 | aurelien | 28 | 	private $masque_recherche = null;
 | 
        
           | 1527 | aurelien | 29 | 	private $code_referentiel = 'bdtfx';
 | 
        
           | 1784 | raphael | 30 |   | 
        
           |  |  | 31 | 	// initialisé à TRUE par rechercherInfosSurTexteCodeOuNumTax()
 | 
        
           |  |  | 32 | 	// si l'espèce passée a le motif <ref>:(nt|nn):<num>, eg: isfan:nt:1591
 | 
        
           |  |  | 33 | 	public $is_notation_spe = FALSE;
 | 
        
           |  |  | 34 |   | 
        
           | 1928 | raphael | 35 |     // un cache utilisé pour les requêtes effectuées sur /service:eflore:0.1/bdtfx/noms?masque=
 | 
        
           |  |  | 36 |     // qui sont lourdes, et parfois identiques (cf cas de l'import XLS)
 | 
        
           |  |  | 37 |     static $cache = array();
 | 
        
           |  |  | 38 |   | 
        
           | 1527 | aurelien | 39 | 	public function RechercheInfosTaxonBeta($config, $code_referentiel = 'bdtfx') {
 | 
        
           |  |  | 40 | 		parent::__construct($config);
 | 
        
           | 1927 | raphael | 41 |         $this->setReferentiel($code_referentiel);
 | 
        
           |  |  | 42 |     }
 | 
        
           |  |  | 43 |   | 
        
           |  |  | 44 |     public function setReferentiel($code_referentiel = 'bdtfx') {
 | 
        
           | 1527 | aurelien | 45 | 		$this->code_referentiel = $code_referentiel;
 | 
        
           | 1927 | raphael | 46 | 		$this->formaterUrlsServices($this->config);
 | 
        
           | 1527 | aurelien | 47 | 	}
 | 
        
           | 2152 | jpm | 48 |   | 
        
           | 1527 | aurelien | 49 | 	private function formaterUrlsServices($config) {
 | 
        
           |  |  | 50 | 		$this->url_service_nom = str_replace('{referentiel}', $this->code_referentiel ,$config['eflore']['url_service_nom']);
 | 
        
           |  |  | 51 | 		$this->url_service_taxon = str_replace('{referentiel}', $this->code_referentiel ,$config['eflore']['url_service_taxon']);
 | 
        
           | 1427 | aurelien | 52 | 		$this->url_service_chorologie_obs = $config['eflore']['url_service_chorologie_obs'];
 | 
        
           | 1852 | raphael | 53 | 		$this->config = $config;
 | 
        
           | 1425 | aurelien | 54 | 	}
 | 
        
           | 2152 | jpm | 55 |   | 
        
           | 1425 | aurelien | 56 | 	public function rechercherGenreEspeceSurPrefixe($genre = null, $espece = null) {
 | 
        
           | 2152 | jpm | 57 | 		$liste_genre_espece = array();
 | 
        
           | 1487 | aurelien | 58 | 		$this->masque_recherche = trim(trim($genre).' '.trim($espece,' *'));
 | 
        
           |  |  | 59 | 		$masque = urlencode($this->masque_recherche);
 | 
        
           | 1926 | raphael | 60 | 		if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'?masque='.$masque.'&recherche=etendue&retour.format=min&navigation.limite=50&ns.structure=au');
 | 
        
           | 2123 | mathias | 61 | 		$urlService = $this->url_service_nom.'?masque='.$masque.'&recherche=etendue&retour.format=min&navigation.limite=50&ns.structure=au';
 | 
        
           |  |  | 62 | 		$requete = @file_get_contents($urlService);
 | 
        
           | 1425 | aurelien | 63 | 		if($requete != '') {
 | 
        
           | 2152 | jpm | 64 | 			$requete = json_decode($requete);
 | 
        
           | 1425 | aurelien | 65 | 			if(is_object($requete) && isset($requete->resultat)) {
 | 
        
           |  |  | 66 | 				foreach ($requete->resultat as $id => $res) {
 | 
        
           | 1427 | aurelien | 67 | 					$retenu = ($res->retenu == "true") ? '3' : '4';
 | 
        
           | 2243 | mathias | 68 | 					$liste_genre_espece[] = array($res->nom_sci_complet, $id, $retenu, $res->nom_sci);
 | 
        
           | 1425 | aurelien | 69 | 				}
 | 
        
           |  |  | 70 | 			}
 | 
        
           | 2152 | jpm | 71 | 			usort($liste_genre_espece, array($this, 'comparerParRetenuPuisNom'));
 | 
        
           | 1425 | aurelien | 72 | 		}
 | 
        
           |  |  | 73 | 		return $liste_genre_espece;
 | 
        
           |  |  | 74 | 	}
 | 
        
           | 2152 | jpm | 75 |   | 
        
           | 1427 | aurelien | 76 | 	function comparerParRetenuPuisNom($a, $b) {
 | 
        
           |  |  | 77 | 		if($a[2] == 3 && $b[2] != 3) {
 | 
        
           |  |  | 78 | 			return -1;
 | 
        
           |  |  | 79 | 		} elseif($a[2] != 3 && $b[2] == 3) {
 | 
        
           |  |  | 80 | 			return 1;
 | 
        
           |  |  | 81 | 		} else {
 | 
        
           | 2243 | mathias | 82 | 			// maintient l'ordre lexicographique - et normalement le genre en premier, en utilisant le nom_sci (sans auteur)
 | 
        
           |  |  | 83 | 			return strcasecmp($a[3], $b[3]);
 | 
        
           |  |  | 84 | 			// @WTF levenshtein c'était juste pour garder le genre en premier ?
 | 
        
           |  |  | 85 | 			//return levenshtein($this->masque_recherche, $a[0]) >= levenshtein($this->masque_recherche, $b[0]);
 | 
        
           | 1427 | aurelien | 86 | 		}
 | 
        
           | 1425 | aurelien | 87 | 	}
 | 
        
           | 2152 | jpm | 88 |   | 
        
           | 1425 | aurelien | 89 | 	public function effectuerRequeteInfosComplementairesEtFormaterNom($numNom) {
 | 
        
           |  |  | 90 | 		$resultat_infos_complementaires = (array)$this->effectuerRequeteInfosComplementairesSurNumNom($numNom);
 | 
        
           |  |  | 91 | 		$retour_infos_complementaires = array();
 | 
        
           | 1780 | raphael | 92 | 		if (isset($resultat_infos_complementaires['nom_retenu_complet']) && $resultat_infos_complementaires['nom_retenu_complet']) {
 | 
        
           | 1926 | raphael | 93 | 			$retour_infos_complementaires=array((self::supprimerBiblio($resultat_infos_complementaires['nom_retenu_complet'])));
 | 
        
           |  |  | 94 | 		}
 | 
        
           | 2152 | jpm | 95 |   | 
        
           | 1425 | aurelien | 96 | 		return $retour_infos_complementaires;
 | 
        
           |  |  | 97 | 	}
 | 
        
           | 2152 | jpm | 98 |   | 
        
           | 1425 | aurelien | 99 | 	public function rechercherInformationsComplementairesSurNom($nom_saisi) {
 | 
        
           | 1487 | aurelien | 100 | 		$nom_saisi = trim($nom_saisi);
 | 
        
           | 1486 | aurelien | 101 | 		// Essai de recherche sur le nom saisi tel quel
 | 
        
           | 1862 | raphael | 102 | 		$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'stricte');
 | 
        
           |  |  | 103 | 		if($liste_genre_espece) return $liste_genre_espece;
 | 
        
           |  |  | 104 |   | 
        
           |  |  | 105 | 		// Essai de recherche stricte en tentant de supprimer le nom d'auteur
 | 
        
           |  |  | 106 | 		if( ($nom_saisi_sans_auteur = self::supprimerAuteur($nom_saisi)) ) { // ne pas faire la requête sur un mot vide
 | 
        
           |  |  | 107 | 			$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi_sans_auteur, 'stricte');
 | 
        
           | 1486 | aurelien | 108 | 		}
 | 
        
           | 1862 | raphael | 109 | 		if($liste_genre_espece) return $liste_genre_espece;
 | 
        
           |  |  | 110 |   | 
        
           |  |  | 111 | 		// avant-dernière tentative : essai de recherche étendue
 | 
        
           |  |  | 112 | 		$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'etendue');
 | 
        
           |  |  | 113 | 		if($liste_genre_espece) return $liste_genre_espece;
 | 
        
           |  |  | 114 |   | 
        
           |  |  | 115 | 		// dernière tentative: concaténation (nom_sci,auteur) (= nom-retenu généré utilisé comme nom_sci)
 | 
        
           |  |  | 116 | 		$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'concat');
 | 
        
           | 2152 | jpm | 117 |   | 
        
           | 1486 | aurelien | 118 | 		return $liste_genre_espece;
 | 
        
           |  |  | 119 | 	}
 | 
        
           | 2152 | jpm | 120 |   | 
        
           | 1862 | raphael | 121 | 	private function effectuerRequeteUrlRecherche($nom_saisi, $mode = 'stricte') {
 | 
        
           | 1928 | raphael | 122 |         $url = sprintf(
 | 
        
           |  |  | 123 |             '%1$s?masque=%2$s&recherche=%3$s&ns.format=txt&retour.champs=%4$s&navigation.limite=1',
 | 
        
           |  |  | 124 |             $this->url_service_nom,
 | 
        
           |  |  | 125 |             urlencode($nom_saisi),
 | 
        
           |  |  | 126 |             $mode,
 | 
        
           |  |  | 127 |             implode(',', array("id","nom_sci","auteur","nom_retenu.id","famille","num_taxonomique","nom_retenu_complet")));
 | 
        
           |  |  | 128 |   | 
        
           |  |  | 129 | 		if(! array_key_exists($url, self::$cache)) {
 | 
        
           |  |  | 130 |             if(self::DEBUG) error_log("CEL fetch: " . $url);
 | 
        
           |  |  | 131 |             $res = @json_decode(file_get_contents($url));
 | 
        
           |  |  | 132 |             self::$cache[$url] = $res;
 | 
        
           |  |  | 133 |         } else {
 | 
        
           |  |  | 134 |             $res = self::$cache[$url];
 | 
        
           |  |  | 135 |         }
 | 
        
           | 1780 | raphael | 136 | 		if(!$res) return NULL;
 | 
        
           |  |  | 137 | 		$resultat = (array)$res->resultat;
 | 
        
           |  |  | 138 | 		return array_pop($resultat);
 | 
        
           | 1486 | aurelien | 139 | 	}
 | 
        
           | 2152 | jpm | 140 |   | 
        
           | 1833 | raphael | 141 | 	static function supprimerAuteur($nom_saisi) {
 | 
        
           | 1486 | aurelien | 142 | 		// TODO: gérer les hybrides
 | 
        
           | 1833 | raphael | 143 | 		if(self::estUnHybride($nom_saisi) || self::estUneFormuleHybridite($nom_saisi)) {
 | 
        
           | 1486 | aurelien | 144 | 			$nom_decoupe = explode(' ', $nom_saisi);
 | 
        
           | 1930 | raphael | 145 | 			$derniere_position_hybride = array_keys($nom_decoupe, 'x');
 | 
        
           |  |  | 146 | 			$nom_saisi_sans_auteur = implode(' ',array_slice($nom_decoupe, 0, end($derniere_position_hybride) + 2));
 | 
        
           | 1486 | aurelien | 147 | 		} else {
 | 
        
           | 1833 | raphael | 148 | 			/* Attention le parseur de nom n'est pas fiable à 100%
 | 
        
           | 2152 | jpm | 149 | 			   mais ça marche dans la plupart des cas
 | 
        
           | 1833 | raphael | 150 | 			   à part les formules d'hybridité saisies avec un auteur */
 | 
        
           |  |  | 151 | 			$nameparser = new NameParser();
 | 
        
           | 1486 | aurelien | 152 | 			$auteur = $nameparser->parse_auth($nom_saisi);
 | 
        
           |  |  | 153 | 			$nom_saisi_sans_auteur = str_replace($auteur, '', $nom_saisi);
 | 
        
           |  |  | 154 | 		}
 | 
        
           |  |  | 155 |   | 
        
           | 1833 | raphael | 156 | 		return trim($nom_saisi_sans_auteur);
 | 
        
           | 1486 | aurelien | 157 | 	}
 | 
        
           | 2152 | jpm | 158 |   | 
        
           | 1833 | raphael | 159 | 	static function estUneFormuleHybridite($nom_saisi) {
 | 
        
           | 1486 | aurelien | 160 | 		return strpos($nom_saisi,' x ') !== false;
 | 
        
           |  |  | 161 | 	}
 | 
        
           | 2152 | jpm | 162 |   | 
        
           | 1833 | raphael | 163 | 	static function estUnHybride($nom_saisi) {
 | 
        
           | 1486 | aurelien | 164 | 		return strpos($nom_saisi,'x ') === 0;
 | 
        
           |  |  | 165 | 	}
 | 
        
           | 2152 | jpm | 166 |   | 
        
           | 1852 | raphael | 167 | 	public function effectuerRequeteInfosComplementairesSurNumNom($num_nom, $ref = NULL) {
 | 
        
           |  |  | 168 | 		if($ref && isset($this->config['eflore']['api_host'])) {
 | 
        
           | 1926 | raphael | 169 | 			if(self::DEBUG) error_log("CEL fetch: " .$this->config['eflore']['api_host'] . '/');
 | 
        
           | 1852 | raphael | 170 | 			return @json_decode(file_get_contents($this->config['eflore']['api_host'] . '/' .
 | 
        
           | 1926 | raphael | 171 | 			$ref . '/' .
 | 
        
           |  |  | 172 | 			'noms' . '/' .
 | 
        
           |  |  | 173 | 			$num_nom .
 | 
        
           |  |  | 174 | 			'?retour.champs=' . implode(',', array('nom_sci,auteur',
 | 
        
           |  |  | 175 | 			'id',
 | 
        
           |  |  | 176 | 			'nom_retenu_complet',
 | 
        
           |  |  | 177 | 			'nom_retenu.id',
 | 
        
           |  |  | 178 | 			'num_taxonomique',
 | 
        
           |  |  | 179 | 			'famille'))));
 | 
        
           | 1852 | raphael | 180 | 		}
 | 
        
           |  |  | 181 | 		// XXX: compat
 | 
        
           | 1926 | raphael | 182 | 		if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'/'.$num_nom.'?retour.champs=nom_sci,auteur,id,nom_retenu_complet,nom_retenu.id,num_taxonomique,famille');
 | 
        
           | 1780 | raphael | 183 | 		return @json_decode(file_get_contents($this->url_service_nom.'/'.$num_nom.'?retour.champs=nom_sci,auteur,id,nom_retenu_complet,nom_retenu.id,num_taxonomique,famille'));
 | 
        
           | 1425 | aurelien | 184 | 	}
 | 
        
           | 1780 | raphael | 185 |   | 
        
           |  |  | 186 | 	static function supprimerBiblio($nom) {
 | 
        
           | 1805 | raphael | 187 | 		return trim(preg_replace('/ \[.*\]/','',$nom));
 | 
        
           | 1425 | aurelien | 188 | 	}
 | 
        
           | 2152 | jpm | 189 |   | 
        
           | 1425 | aurelien | 190 | 	public function rechercherNumTaxSurNumNom($num_nom) {
 | 
        
           |  |  | 191 | 		$nt = null;
 | 
        
           | 1427 | aurelien | 192 | 		$url = $this->url_service_nom."/".$num_nom.'?retour.champs=num_taxonomique';
 | 
        
           | 1926 | raphael | 193 | 		if(self::DEBUG) error_log("CEL fetch: $url");
 | 
        
           | 1425 | aurelien | 194 | 		$resultat = @file_get_contents($url);
 | 
        
           |  |  | 195 | 		if($resultat != '') {
 | 
        
           |  |  | 196 | 			$infos = json_decode($resultat);
 | 
        
           |  |  | 197 | 			$nt = $infos->num_taxonomique;
 | 
        
           |  |  | 198 | 		}
 | 
        
           | 2152 | jpm | 199 |   | 
        
           | 1425 | aurelien | 200 | 		return $nt;
 | 
        
           |  |  | 201 | 	}
 | 
        
           | 2152 | jpm | 202 |   | 
        
           | 1425 | aurelien | 203 | 	public function taxonEstPresentDansDepartement($num_taxon,$code_departement) {
 | 
        
           |  |  | 204 | 		$presence_taxon = false;
 | 
        
           | 1427 | aurelien | 205 | 		$url = $this->url_service_chorologie_obs.'?masque.departement='.$code_departement.'&masque.determination.nt='.$num_taxon.'&navigation.limite=1';
 | 
        
           | 1926 | raphael | 206 | 		if(self::DEBUG) error_log("CEL fetch: $url");
 | 
        
           | 1425 | aurelien | 207 | 		$resultat = @file_get_contents($url);
 | 
        
           |  |  | 208 | 		if($resultat != '') {
 | 
        
           |  |  | 209 | 			$resultat = json_decode($resultat);
 | 
        
           |  |  | 210 | 			if(is_object($resultat) && isset($resultat->resultat) && count($resultat->resultat) > 0) {
 | 
        
           |  |  | 211 | 				$presence_taxon = true;
 | 
        
           |  |  | 212 | 			}
 | 
        
           |  |  | 213 | 		}
 | 
        
           |  |  | 214 | 		return $presence_taxon;
 | 
        
           |  |  | 215 | 	}
 | 
        
           | 2152 | jpm | 216 |   | 
        
           |  |  | 217 | 	/* texte libre, nom scientifique,
 | 
        
           |  |  | 218 | 	   ou code nomenclatural (format bdtfx:nn:999999)
 | 
        
           | 1784 | raphael | 219 | 	   ou code taxonomique (format bdtfx:nt:999999)
 | 
        
           | 1780 | raphael | 220 | 	   TODO: voir ce qu'on fait pour l'import de différent référentiels */
 | 
        
           | 1425 | aurelien | 221 | 	function rechercherInfosSurTexteCodeOuNumTax($identifiant_espece) {
 | 
        
           | 1784 | raphael | 222 | 		preg_match('/(' . implode('|', Cel::$referentiels_valides) .'):(nn|nt):(\d+)/i', $identifiant_espece, $elements);
 | 
        
           |  |  | 223 | 		if($elements) {
 | 
        
           |  |  | 224 | 			$this->is_notation_spe = TRUE;
 | 
        
           |  |  | 225 | 			list(, $ref, $type, $num) = $elements;
 | 
        
           | 1796 | raphael | 226 |   | 
        
           |  |  | 227 | 			if($ref != $this->code_referentiel) {
 | 
        
           |  |  | 228 | 				// TODO: ignorer la colonne référentiel, et utiliser le référentiel donné
 | 
        
           |  |  | 229 | 				// mais il faut alors avertir le service (d'import/modif) d'utiliser le référentiel
 | 
        
           |  |  | 230 | 				// passé au nom d'espèce
 | 
        
           | 1852 | raphael | 231 | 				// Seul le effectuerRequeteInfosComplementairesSurNumNom() le supporte, car c'est encore
 | 
        
           |  |  | 232 | 				// un peu complexe à implémenter proprement pour cause d'attributs de classes.
 | 
        
           | 1796 | raphael | 233 | 			}
 | 
        
           | 1784 | raphael | 234 | 			// Numero nomenclatural
 | 
        
           |  |  | 235 | 			if ($type == 'nn') {
 | 
        
           | 1852 | raphael | 236 | 				$obj = $this->effectuerRequeteInfosComplementairesSurNumNom($num, $ref);
 | 
        
           | 1784 | raphael | 237 | 			}
 | 
        
           |  |  | 238 | 			// Numero taxonomique
 | 
        
           |  |  | 239 | 			else {
 | 
        
           |  |  | 240 | 				//TODO: retourner moins de champs grâce au paramètre retour.champs
 | 
        
           | 1926 | raphael | 241 | 				if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_taxon."/nt:".$num);
 | 
        
           | 1784 | raphael | 242 | 				$obj = @json_decode(file_get_contents($this->url_service_taxon."/nt:".$num));
 | 
        
           |  |  | 243 | 			}
 | 
        
           | 1796 | raphael | 244 | 			if($obj) $obj->ref = $ref;
 | 
        
           | 1784 | raphael | 245 | 			return $obj;
 | 
        
           |  |  | 246 | 		}
 | 
        
           | 1746 | raphael | 247 |   | 
        
           | 1780 | raphael | 248 | 		// Nom scientifique
 | 
        
           |  |  | 249 | 		return $this->rechercherInformationsComplementairesSurNom($identifiant_espece);
 | 
        
           | 1425 | aurelien | 250 | 	}
 | 
        
           | 2152 | jpm | 251 |   | 
        
           | 1591 | aurelien | 252 | 	public function rechercherSynonymesSurNumNom($num_nom) {
 | 
        
           |  |  | 253 | 		$retour = array();
 | 
        
           | 1926 | raphael | 254 | 		if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'/'.$num_nom.'/relations/synonymie/?retour.format=min');
 | 
        
           | 1780 | raphael | 255 | 		$resultat = @file_get_contents($this->url_service_nom.'/'.$num_nom.'/relations/synonymie/?retour.format=min');
 | 
        
           | 1591 | aurelien | 256 | 		if($resultat != '') {
 | 
        
           |  |  | 257 | 			$resultat = json_decode($resultat);
 | 
        
           |  |  | 258 | 			if(is_object($resultat) && isset($resultat->resultat) && count($resultat->resultat) > 0) {
 | 
        
           |  |  | 259 | 				$retour = $resultat->resultat;
 | 
        
           |  |  | 260 | 			}
 | 
        
           |  |  | 261 | 		}
 | 
        
           |  |  | 262 | 		return $retour;
 | 
        
           |  |  | 263 | 	}
 | 
        
           | 2152 | jpm | 264 | }
 |