New file |
0,0 → 1,261 |
<?php |
/** |
* PHP Version 5 |
* |
* @category PHP |
* @package jrest |
* @author David Delon <david@tela-botania.org> |
* @author Aurélien Peronnet <aurelien@tela-botania.org> |
* @copyright 2010 Tela-Botanica |
* @license http://www.cecill.info/licences/Licence_CeCILL_V2-fr.txt Licence CECILL |
* @version SVN: <svn_id> |
* @link /doc/jrest/ |
*/ |
|
/** |
* |
* La classe appelle les web service d'eflore pour éviter que le code client |
* ne soit dépendant de la version d'eflore |
*/ |
class RechercheInfosTaxonBeta extends Cel { |
|
const DEBUG = FALSE; |
|
private $url_service_nom = null; |
private $url_service_taxon = null; |
private $url_service_chorologie = null; |
|
private $masque_recherche = null; |
private $code_referentiel = 'bdtfx'; |
|
// initialisé à TRUE par rechercherInfosSurTexteCodeOuNumTax() |
// si l'espèce passée a le motif <ref>:(nt|nn):<num>, eg: isfan:nt:1591 |
public $is_notation_spe = FALSE; |
|
// un cache utilisé pour les requêtes effectuées sur /service:eflore:0.1/bdtfx/noms?masque= |
// qui sont lourdes, et parfois identiques (cf cas de l'import XLS) |
static $cache = array(); |
|
public function RechercheInfosTaxonBeta($config, $code_referentiel = 'bdtfx') { |
parent::__construct($config); |
$this->setReferentiel($code_referentiel); |
} |
|
public function setReferentiel($code_referentiel = 'bdtfx') { |
$this->code_referentiel = $code_referentiel; |
$this->formaterUrlsServices($this->config); |
} |
|
private function formaterUrlsServices($config) { |
$this->url_service_nom = str_replace('{referentiel}', $this->code_referentiel ,$config['eflore']['url_service_nom']); |
$this->url_service_taxon = str_replace('{referentiel}', $this->code_referentiel ,$config['eflore']['url_service_taxon']); |
$this->url_service_chorologie_obs = $config['eflore']['url_service_chorologie_obs']; |
$this->config = $config; |
} |
|
public function rechercherGenreEspeceSurPrefixe($genre = null, $espece = null) { |
$liste_genre_espece = array(); |
$this->masque_recherche = trim(trim($genre).' '.trim($espece,' *')); |
$masque = urlencode($this->masque_recherche); |
if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'?masque='.$masque.'&recherche=etendue&retour.format=min&navigation.limite=50&ns.structure=au'); |
$urlService = $this->url_service_nom.'?masque='.$masque.'&recherche=etendue&retour.format=min&navigation.limite=50&ns.structure=au'; |
$requete = @file_get_contents($urlService); |
if($requete != '') { |
$requete = json_decode($requete); |
if(is_object($requete) && isset($requete->resultat)) { |
foreach ($requete->resultat as $id => $res) { |
$retenu = ($res->retenu == "true") ? '3' : '4'; |
$liste_genre_espece[] = array($res->nom_sci_complet, $id, $retenu); |
} |
} |
usort($liste_genre_espece, array($this, 'comparerParRetenuPuisNom')); |
} |
return $liste_genre_espece; |
} |
|
function comparerParRetenuPuisNom($a, $b) { |
if($a[2] == 3 && $b[2] != 3) { |
return -1; |
} elseif($a[2] != 3 && $b[2] == 3) { |
return 1; |
} else { |
return levenshtein($this->masque_recherche, $a[0]) >= levenshtein($this->masque_recherche, $b[0]); |
} |
} |
|
public function effectuerRequeteInfosComplementairesEtFormaterNom($numNom) { |
$resultat_infos_complementaires = (array)$this->effectuerRequeteInfosComplementairesSurNumNom($numNom); |
$retour_infos_complementaires = array(); |
if (isset($resultat_infos_complementaires['nom_retenu_complet']) && $resultat_infos_complementaires['nom_retenu_complet']) { |
$retour_infos_complementaires=array((self::supprimerBiblio($resultat_infos_complementaires['nom_retenu_complet']))); |
} |
|
return $retour_infos_complementaires; |
} |
|
public function rechercherInformationsComplementairesSurNom($nom_saisi) { |
$nom_saisi = trim($nom_saisi); |
// Essai de recherche sur le nom saisi tel quel |
$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'stricte'); |
if($liste_genre_espece) return $liste_genre_espece; |
|
// Essai de recherche stricte en tentant de supprimer le nom d'auteur |
if( ($nom_saisi_sans_auteur = self::supprimerAuteur($nom_saisi)) ) { // ne pas faire la requête sur un mot vide |
$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi_sans_auteur, 'stricte'); |
} |
if($liste_genre_espece) return $liste_genre_espece; |
|
// avant-dernière tentative : essai de recherche étendue |
$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'etendue'); |
if($liste_genre_espece) return $liste_genre_espece; |
|
// dernière tentative: concaténation (nom_sci,auteur) (= nom-retenu généré utilisé comme nom_sci) |
$liste_genre_espece = $this->effectuerRequeteUrlRecherche($nom_saisi, 'concat'); |
|
return $liste_genre_espece; |
} |
|
private function effectuerRequeteUrlRecherche($nom_saisi, $mode = 'stricte') { |
$url = sprintf( |
'%1$s?masque=%2$s&recherche=%3$s&ns.format=txt&retour.champs=%4$s&navigation.limite=1', |
$this->url_service_nom, |
urlencode($nom_saisi), |
$mode, |
implode(',', array("id","nom_sci","auteur","nom_retenu.id","famille","num_taxonomique","nom_retenu_complet"))); |
|
if(! array_key_exists($url, self::$cache)) { |
if(self::DEBUG) error_log("CEL fetch: " . $url); |
$res = @json_decode(file_get_contents($url)); |
self::$cache[$url] = $res; |
} else { |
$res = self::$cache[$url]; |
} |
if(!$res) return NULL; |
$resultat = (array)$res->resultat; |
return array_pop($resultat); |
} |
|
static function supprimerAuteur($nom_saisi) { |
// TODO: gérer les hybrides |
if(self::estUnHybride($nom_saisi) || self::estUneFormuleHybridite($nom_saisi)) { |
$nom_decoupe = explode(' ', $nom_saisi); |
$derniere_position_hybride = array_keys($nom_decoupe, 'x'); |
$nom_saisi_sans_auteur = implode(' ',array_slice($nom_decoupe, 0, end($derniere_position_hybride) + 2)); |
} else { |
/* Attention le parseur de nom n'est pas fiable à 100% |
mais ça marche dans la plupart des cas |
à part les formules d'hybridité saisies avec un auteur */ |
$nameparser = new NameParser(); |
$auteur = $nameparser->parse_auth($nom_saisi); |
$nom_saisi_sans_auteur = str_replace($auteur, '', $nom_saisi); |
} |
|
return trim($nom_saisi_sans_auteur); |
} |
|
static function estUneFormuleHybridite($nom_saisi) { |
return strpos($nom_saisi,' x ') !== false; |
} |
|
static function estUnHybride($nom_saisi) { |
return strpos($nom_saisi,'x ') === 0; |
} |
|
public function effectuerRequeteInfosComplementairesSurNumNom($num_nom, $ref = NULL) { |
if($ref && isset($this->config['eflore']['api_host'])) { |
if(self::DEBUG) error_log("CEL fetch: " .$this->config['eflore']['api_host'] . '/'); |
return @json_decode(file_get_contents($this->config['eflore']['api_host'] . '/' . |
$ref . '/' . |
'noms' . '/' . |
$num_nom . |
'?retour.champs=' . implode(',', array('nom_sci,auteur', |
'id', |
'nom_retenu_complet', |
'nom_retenu.id', |
'num_taxonomique', |
'famille')))); |
} |
// XXX: compat |
if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'/'.$num_nom.'?retour.champs=nom_sci,auteur,id,nom_retenu_complet,nom_retenu.id,num_taxonomique,famille'); |
return @json_decode(file_get_contents($this->url_service_nom.'/'.$num_nom.'?retour.champs=nom_sci,auteur,id,nom_retenu_complet,nom_retenu.id,num_taxonomique,famille')); |
} |
|
static function supprimerBiblio($nom) { |
return trim(preg_replace('/ \[.*\]/','',$nom)); |
} |
|
public function rechercherNumTaxSurNumNom($num_nom) { |
$nt = null; |
$url = $this->url_service_nom."/".$num_nom.'?retour.champs=num_taxonomique'; |
if(self::DEBUG) error_log("CEL fetch: $url"); |
$resultat = @file_get_contents($url); |
if($resultat != '') { |
$infos = json_decode($resultat); |
$nt = $infos->num_taxonomique; |
} |
|
return $nt; |
} |
|
public function taxonEstPresentDansDepartement($num_taxon,$code_departement) { |
$presence_taxon = false; |
$url = $this->url_service_chorologie_obs.'?masque.departement='.$code_departement.'&masque.determination.nt='.$num_taxon.'&navigation.limite=1'; |
if(self::DEBUG) error_log("CEL fetch: $url"); |
$resultat = @file_get_contents($url); |
if($resultat != '') { |
$resultat = json_decode($resultat); |
if(is_object($resultat) && isset($resultat->resultat) && count($resultat->resultat) > 0) { |
$presence_taxon = true; |
} |
} |
return $presence_taxon; |
} |
|
/* texte libre, nom scientifique, |
ou code nomenclatural (format bdtfx:nn:999999) |
ou code taxonomique (format bdtfx:nt:999999) |
TODO: voir ce qu'on fait pour l'import de différent référentiels */ |
function rechercherInfosSurTexteCodeOuNumTax($identifiant_espece) { |
preg_match('/(' . implode('|', Cel::$referentiels_valides) .'):(nn|nt):(\d+)/i', $identifiant_espece, $elements); |
if($elements) { |
$this->is_notation_spe = TRUE; |
list(, $ref, $type, $num) = $elements; |
|
if($ref != $this->code_referentiel) { |
// TODO: ignorer la colonne référentiel, et utiliser le référentiel donné |
// mais il faut alors avertir le service (d'import/modif) d'utiliser le référentiel |
// passé au nom d'espèce |
// Seul le effectuerRequeteInfosComplementairesSurNumNom() le supporte, car c'est encore |
// un peu complexe à implémenter proprement pour cause d'attributs de classes. |
} |
// Numero nomenclatural |
if ($type == 'nn') { |
$obj = $this->effectuerRequeteInfosComplementairesSurNumNom($num, $ref); |
} |
// Numero taxonomique |
else { |
//TODO: retourner moins de champs grâce au paramètre retour.champs |
if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_taxon."/nt:".$num); |
$obj = @json_decode(file_get_contents($this->url_service_taxon."/nt:".$num)); |
} |
if($obj) $obj->ref = $ref; |
return $obj; |
} |
|
// Nom scientifique |
return $this->rechercherInformationsComplementairesSurNom($identifiant_espece); |
} |
|
public function rechercherSynonymesSurNumNom($num_nom) { |
$retour = array(); |
if(self::DEBUG) error_log("CEL fetch: " . $this->url_service_nom.'/'.$num_nom.'/relations/synonymie/?retour.format=min'); |
$resultat = @file_get_contents($this->url_service_nom.'/'.$num_nom.'/relations/synonymie/?retour.format=min'); |
if($resultat != '') { |
$resultat = json_decode($resultat); |
if(is_object($resultat) && isset($resultat->resultat) && count($resultat->resultat) > 0) { |
$retour = $resultat->resultat; |
} |
} |
return $retour; |
} |
} |