Rev 965 | Blame | Compare with Previous | Last modification | View Log | RSS feed
<?php/** Exemple lancement:* /opt/lampp/bin/php -d memory_limit=3500M ~/web/eflore-projets/scripts/cli.php sauvages -a chargerTous*/class Sauvages extends EfloreScript {private $contenu_fichier = array();protected $parametres_autorises = array('-f' => array(true, true, 'Nom du fichier ou du dossier à traiter'));private $caracteresAccentues = array('À', 'Á', 'Â', 'Ã', 'Ä', 'Å', 'Æ', 'Ç', 'È', 'É', 'Ê', 'Ë', 'Ì', 'Í', 'Î','Ï', 'Ð', 'Ñ', 'Ò', 'Ó', 'Ô', 'Õ', 'Ö', 'Ø', 'Ù', 'Ú', 'Û', 'Ü', 'Ý', 'ß','à', 'á', 'â', 'ã', 'ä', 'å', 'æ', 'ç', 'è', 'é', 'ê', 'ë', 'ì', 'í', 'î','ï', 'ñ', 'ò', 'ó', 'ô', 'õ', 'ö', 'ø', 'ù', 'ú', 'û', 'ü', 'ý', 'ÿ', 'Ā','ā', 'Ă', 'ă', 'Ą', 'ą', 'Ć', 'ć', 'Ĉ', 'ĉ', 'Ċ', 'ċ', 'Č', 'č', 'Ď', 'ď','Đ', 'đ', 'Ē', 'ē', 'Ĕ', 'ĕ', 'Ė', 'ė', 'Ę', 'ę', 'Ě', 'ě', 'Ĝ', 'ĝ', 'Ğ','ğ', 'Ġ', 'ġ', 'Ģ', 'ģ', 'Ĥ', 'ĥ', 'Ħ', 'ħ', 'Ĩ', 'ĩ', 'Ī', 'ī', 'Ĭ', 'ĭ','Į', 'į', 'İ', 'ı', 'IJ', 'ij', 'Ĵ', 'ĵ', 'Ķ', 'ķ', 'Ĺ', 'ĺ', 'Ļ', 'ļ', 'Ľ','ľ', 'Ŀ', 'ŀ', 'Ł', 'ł', 'Ń', 'ń', 'Ņ', 'ņ', 'Ň', 'ň', 'ʼn', 'Ō', 'ō', 'Ŏ','ŏ', 'Ő', 'ő', 'Œ', 'œ', 'Ŕ', 'ŕ', 'Ŗ', 'ŗ', 'Ř', 'ř', 'Ś', 'ś', 'Ŝ', 'ŝ','Ş', 'ş', 'Š', 'š', 'Ţ', 'ţ', 'Ť', 'ť', 'Ŧ', 'ŧ', 'Ũ', 'ũ', 'Ū', 'ū', 'Ŭ','ŭ', 'Ů', 'ů', 'Ű', 'ű', 'Ų', 'ų', 'Ŵ', 'ŵ', 'Ŷ', 'ŷ', 'Ÿ', 'Ź', 'ź', 'Ż','ż', 'Ž', 'ž', 'ſ', 'ƒ', 'Ơ', 'ơ', 'Ư', 'ư', 'Ǎ', 'ǎ', 'Ǐ', 'ǐ', 'Ǒ', 'ǒ','Ǔ', 'ǔ', 'Ǖ', 'ǖ', 'Ǘ', 'ǘ', 'Ǚ', 'ǚ', 'Ǜ', 'ǜ', 'Ǻ', 'ǻ', 'Ǽ', 'ǽ', 'Ǿ', 'ǿ');private $caracteresNormaux = array('A', 'A', 'A', 'A', 'A', 'A', 'AE', 'C', 'E', 'E', 'E', 'E', 'I', 'I', 'I','I', 'D', 'N', 'O', 'O', 'O', 'O', 'O', 'O', 'U', 'U', 'U', 'U', 'Y', 's','a', 'a', 'a', 'a', 'a', 'a', 'ae', 'c', 'e', 'e', 'e', 'e', 'i', 'i', 'i','i', 'n', 'o', 'o', 'o', 'o', 'o', 'o', 'u', 'u', 'u', 'u', 'y', 'y', 'A', 'a','A', 'a', 'A', 'a', 'C', 'c', 'C', 'c', 'C', 'c', 'C', 'c', 'D', 'd', 'D', 'd','E', 'e', 'E', 'e', 'E', 'e', 'E', 'e', 'E', 'e', 'G', 'g', 'G', 'g', 'G', 'g','G', 'g', 'H', 'h', 'H', 'h', 'I', 'i', 'I', 'i', 'I', 'i', 'I', 'i', 'I', 'i','IJ', 'ij', 'J', 'j', 'K', 'k', 'L', 'l', 'L', 'l', 'L', 'l', 'L', 'l', 'l', 'l','N', 'n', 'N', 'n', 'N', 'n', 'n', 'O', 'o', 'O', 'o', 'O', 'o', 'OE', 'oe', 'R','r', 'R', 'r', 'R', 'r', 'S', 's', 'S', 's', 'S', 's', 'S', 's', 'T', 't', 'T', 't','T', 't', 'U', 'u', 'U', 'u', 'U', 'u', 'U', 'u', 'U', 'u', 'U', 'u', 'W', 'w', 'Y','y', 'Y', 'Z', 'z', 'Z', 'z', 'Z', 'z', 's', 'f', 'O', 'o', 'U', 'u', 'A', 'a', 'I','i', 'O', 'o', 'U', 'u', 'U', 'u', 'U', 'u', 'U', 'u', 'U', 'u', 'A', 'a', 'AE', 'ae', 'O', 'o');public function executer() {// Lancement de l'action demandéetry {$this->initialiserProjet('sauvages');$cmd = $this->getParametre('a');switch ($cmd) {case 'chargerTous' :$this->creerXmlTaxons();$this->creerXmlCriteres();break;case 'creerXmlCriteres' :$this->creerXmlCriteres();break;case 'creerXmlTaxons' :$this->creerXmlTaxons();break;default :throw new Exception("Erreur : la commande '$cmd' n'existe pas!");}} catch (Exception $e) {$this->traiterErreur($e->getMessage());}}public function creerXmlCriteres() {$this->recupererContenuFichier();$criteres_nom = $this->contenu_fichier[0];unset($this->contenu_fichier[0]);$criteres_label = $this->contenu_fichier[1];unset($this->contenu_fichier[1]);$description_label = $this->contenu_fichier[2];unset($this->contenu_fichier[2]);$criteres_valeurs = $this->extraireValeurs();$xml = $this->formerXmlCriteres($criteres_nom, $criteres_label, $description_label, $criteres_valeurs);//print_r($xml);file_put_contents("./xml_criteres.xml", $xml);}public function formerXmlCriteres($nom, $label, $description, $valeurs) {$xml='<keys><groupe id="1"><nom>Arbres</nom><media>images/pictos/icone_arbre.png</media><criteres>';foreach ($label as $id=>$criteres) {if ($id > 3) {$xml .= '<critere id="1.'.$id.'"><label>'.$criteres.'</label><description>'.$description[$id].'</description><valeurs>';foreach ($valeurs[$id] as $id_val=>$valeur) {if ($valeur != "0") {$crit = str_replace(" ", "_", $this->supprimerAccents($nom[$id]));$val = str_replace(" ", "_", $this->supprimerAccents($valeur));$image = $crit."_".$val;$xml .= '<valeur code="1.'.$id.'.'.$id_val.'" media="images/pictos/'.$image.'.png">'.$valeur.'</valeur>';}}$xml .= '</valeurs></critere>';}}$xml .= "</criteres></groupe></keys>";return $xml;}private function extraireValeurs() {$valeurs = array();foreach ($this->contenu_fichier as $ligne) {$i = 0;if ($ligne != "") {foreach ($ligne as $critere) {$valeur_multiple = explode("/", $critere);foreach ($valeur_multiple as $valeur) {if (!isset($valeurs[$i]) || !in_array(trim($valeur), $valeurs[$i])) {$valeurs[$i][] = trim($valeur);}}$i++;}}}return $valeurs;}public function creerXmlTaxons() {$this->recupererContenuFichier();$criteres_label = array_flip($this->contenu_fichier[0]);unset($this->contenu_fichier[0]);unset($this->contenu_fichier[1]);unset($this->contenu_fichier[2]);$criteres_valeurs = $this->extraireValeurs();$xml = $this->formerXmlTaxons($criteres_label, $criteres_valeurs); //print_r($xml);file_put_contents("./xml_taxons.xml", $xml);}public function formerXmlTaxons($criteres_label, $criteres_valeurs) {$xml='<?xml version="1.0" ?><TAXONS SUBJECT="XML">';$rest = new RestClient();foreach ($this->contenu_fichier as $id=>$taxon) {if ($taxon != "") {$infos_taxon = $this->rechercherInfosTaxon($rest, $taxon[$criteres_label["nom scientifique"]]);$xml .= '<TAXON id="'.$id.'" value="'.ucfirst($taxon[$criteres_label["nom vernaculaire"]]).'" sciName="'.trim($taxon[$criteres_label["nom scientifique"]]).'" groupe="1"><DESCRIPTION>'.$infos_taxon["description"].'</DESCRIPTION><PICTURES>';if ($infos_taxon["images"] != array()) {if (isset($infos_taxon["images"][$taxon[$criteres_label["image priorite"]]])) {$auteur = $this->rechercherInfosAuteurImage($infos_taxon["images"][$taxon[$criteres_label["image priorite"]]], $rest).", www.tela-botanica.org, CC-Licence (by-sa)";$xml .= '<PICTURE media="'.$infos_taxon["images"][$taxon[$criteres_label["image priorite"]]]["binaire.href"].'"><author>'.$auteur.'</author></PICTURE>';unset($infos_taxon["images"][$taxon[$criteres_label["image priorite"]]]);}foreach ($infos_taxon["images"] as $image) {$auteur = $this->rechercherInfosAuteurImage($image, $rest).", www.tela-botanica.org, CC-Licence (by-sa)";$xml .= '<PICTURE media="'.$image["binaire.href"].'"><author>'.$auteur.'</author></PICTURE>';}}$xml .= '</PICTURES><CRITERIAS>';for ($i=4; $i < count($taxon); $i++) {if (trim($taxon[$i]) !== "0") {$valeurs = array();foreach (explode("/",$taxon[$i]) as $valeur) {$valeurs[] = '1.'.$i.'.'.array_search(trim($valeur), $criteres_valeurs[$i]);}$xml .= '<VALUE code="'.implode(',', $valeurs).'"/>';}}$xml .= '</CRITERIAS></TAXON>';}}$xml .= "</TAXONS>";return $xml;}// interroge l'annuaire pour récupérer le pseudoprivate function rechercherInfosAuteurImage($image, $rest) {$courriel = $image["observation"]["auteur.courriel"];$url_auteur = "http://www.tela-botanica.org/service:annuaire:utilisateur/identite-par-courriel/".$courriel;$reponse = $rest->consulter($url_auteur);$reponse = json_decode($reponse, true);if (isset($reponse[$courriel]) && $reponse[$courriel]["pseudoUtilise"] == true) {$auteur = $reponse[$courriel]["pseudo"];} else{$auteur = $image["observation"]["auteur.prenom"]." ".$image["observation"]["auteur.nom"];}return $auteur;}private function rechercherInfosTaxon($rest, $ns) {$info = array("description" => "", "images" => array());$reponse = $this->consulterWebService($rest, "bdtfx","noms", "?retour.champs=nom_retenu.id,num_taxonomique&retour.tri=retenu&masque=".urlencode(trim($ns)));if (is_array($reponse["resultat"])) {$num_nom = $reponse["resultat"][key($reponse["resultat"])]["nom_retenu.id"];$num_taxon = $reponse["resultat"][key($reponse["resultat"])]['num_taxonomique'];}$info["description"] = $this->rechercherDescription($num_taxon, $num_nom, $rest);$info["images"] =array();$tags = array('fleur', 'feuille', 'rameau', 'port', 'fruit');$cles = array();foreach ($tags as $tag) {$url_image = "http://www.tela-botanica.org/service:del:0.1/images"."?masque.referentiel=bdtfx&masque.tag={$tag}&tri=votes&ordre=desc&protocole=3&navigation.limite=1&format=CRS&masque.nn=".$num_nom;$image = $rest->consulter($url_image);$image = json_decode($image, true);if ($image["resultats"] !== array()) {$info["images"][$tag]["binaire.href"] = $image["resultats"][key($image["resultats"])]["binaire.href"];$info["images"][$tag]["observation"] = $image["resultats"][key($image["resultats"])]["observation"];$cles[key($image["resultats"])] = "";}}//si image taguée absente$url_image = "http://www.tela-botanica.org/service:del:0.1/images"."?masque.referentiel=bdtfx&tri=votes&ordre=desc&protocole=3&navigation.limite=5&format=CRS&masque.nn=".$num_nom;$reponse = $rest->consulter($url_image);$reponse = json_decode($reponse, true);if ($cles !== array()) {// supprimer les images communes au tag et les mieux notés$reponse["resultats"] = array_diff_key($reponse["resultats"], $cles);for ($i = 0; $i < 5-count($cles); $i++) {$image = array_shift($reponse["resultats"]);$info["images"][$i]["binaire.href"] = $image["binaire.href"];$info["images"][$i]["observation"] = $image["observation"];}} else {$info["images"] = $reponse["resultats"];}return $info;}private function rechercherDescription($num_taxon, $num_nom, $rest) {$url_wiki = "http://www.tela-botanica.org/wikini/eFloreRedaction/api/rest/0.5/pages/SmartFloreBDTFXnt".$num_taxon."?txt.format=text/plain&txt.section.titre=Comment%20la%20reconnaître%20%3F";$wiki = $rest->consulter($url_wiki); $wiki = json_decode($wiki, true);if ($wiki['texte'] != "" && strstr($wiki['texte'], 'Brève phrase sur son type biologique (simplifié)') === false ){$description = $this->formaterSmartflore($wiki['texte']);} else {$coste = $this->consulterWebService($rest, "coste", "textes", "/bdtfx.nn:".$num_nom);if ($coste['resultats'] != array() && $coste['resultats'][key($coste["resultats"])]['texte'] != "") {$description = $this->formaterCoste($coste['resultats']);} else {$baseflor = $this->consulterWebService($rest, "baseflor", "informations", "/bdtfx.nn:".$num_nom);$description = $this->formaterBaseflor($baseflor);}}return $description;}//remplacement des \n par <br />private function formaterSmartflore($texte) {$a_enlever = array(Chr(10).'=', '='.Chr(10), Chr(10).''.Chr(10), '*');$texte = str_replace($a_enlever, '', $texte);$texte = str_replace(Chr(10), '<br />', $texte);//supprimer image et lien$texte = preg_replace('/\[\[http\:\/\/upload.*\.jpg [a-z| |A-Z]*\]\]/', '', $texte);$texte = str_replace('[[http://fr.wikipedia.org/wiki/Corymbe corymbes]]', 'corymbes', $texte);$texte = preg_replace('/\[\[SmartFlore.*[0-9] (.*)\]\]/', '\1', $texte);$texte = preg_replace('/\[\[http\:\/\/www\..* (.*)\]\]/', '\1', $texte);$texte = trim(str_replace('<br /><br />', '<br />', $texte));return $texte;}private function formaterCoste($coste) {$texte = $this->mettreEnFormeCoste($coste[key($coste)]['texte']);return $texte;}static function mettreEnFormeCoste($texte) {$txt_fmt = array();//decouper elements remarquables avant le texteself::separerNomScientifique_a_NomCommun($texte, $txt_fmt);$txt_fmt = array();$texte = preg_replace('/\//','',$texte);//decouper elements remarquables après le texteself::separerEcologie_a_Usages($texte, $txt_fmt);//le morceau qui reste est le gros de la description$texte = str_replace(';','</br> -','- '.$texte);$texte = str_replace('–','',$texte);$txt_fmt['description'] = $texte;$retour = "";foreach ($txt_fmt as $titre=>$parag) {$parag = preg_replace('/\- \. /','- ',$parag);$parag = preg_replace('/\. \./','.',$parag);$retour .= ucfirst($titre)." : ".trim($parag)." ; ";}return $retour;}static function separerNomScientifique_a_NomCommun(&$txt, &$txt_fmt){if ( preg_match('/\*\*(.+)\*\*([^–]*)–/', $txt, $retour)){/* !! attention on enlève un tiret cadratin – pas un trait d'union - !! */$a_enlever = array('/–/','/\./' );$txt_fmt['nom_scientifique'] = preg_replace($a_enlever,'',$retour[1]);if(preg_match('/\((.+)\)/',$retour[2],$synonymes)){$txt_fmt['synonymes'] = $synonymes[1];} else {$txt_fmt['nom_scientifique'] .= $retour[2];}$txt = str_replace($retour[0],'',$txt);}/* !! attention il y a un espace avant les // du début !! */if ( preg_match('/^ \/\/([^\/\/]+)\/\//', $txt, $retour)){$a_enlever = array('/–/','/\./' );$txt_fmt['nom_commun'] = preg_replace($a_enlever,'',$retour[1]);$txt = str_replace($retour[0],'',$txt);}}static function separerEcologie_a_Usages(&$txt, &$txt_fmt) {if (preg_match('/\.\s*([A-ZÉÀÈ].+)$/',$txt, $retour)) {$txt_fmt['ecologie'] = $retour[1];$txt = str_replace($retour[0],'.',$txt);if (isset($txt_fmt['ecologie']) && preg_match('/–(.+)/', $txt_fmt['ecologie'] , $retour)){$txt_fmt['repartition'] = $retour[1];$txt_fmt['ecologie'] = str_replace($retour[0],'',$txt_fmt['ecologie']);}if (isset($txt_fmt['repartition']) && preg_match('/=(.+)$/', $txt_fmt['repartition'], $retour)){$txt_fmt['floraison'] = $retour[1];$txt_fmt['repartition'] = str_replace($retour[0],'',$txt_fmt['repartition']);$txt_fmt['repartition'] = str_replace(';',',',$txt_fmt['repartition']);}if (isset($txt_fmt['floraison']) && preg_match('/–(.+)$|\n(.+)$/',$txt_fmt['floraison'], $retour)){$txt_fmt['usages'] = isset($retour[1]) ? $retour[1] : $retour[2];$txt_fmt['floraison'] = str_replace($retour[0],'.',$txt_fmt['floraison']);}if (isset($txt_fmt['floraison']) && preg_match('/([Ff]l\.) (.+)/',$txt_fmt['floraison'], $retour)){$txt_fmt['floraison'] = $retour[2];$txt_fmt['floraison'] = str_replace($retour[1],'',$txt_fmt['floraison']);}if (isset($txt_fmt['floraison']) && preg_match('/([Ff]r\.) (.+)/',$txt_fmt['floraison'], $retour)){$txt_fmt['fructification'] = $retour[2];$txt_fmt['floraison'] = str_replace($retour[0],'',$txt_fmt['floraison']);$txt_fmt['floraison'] = str_replace(',','',$txt_fmt['floraison']);$txt_fmt['fructification'] = str_replace($retour[1],'',$txt_fmt['fructification']);$txt_fmt['fructification'] = str_replace('.','',$txt_fmt['fructification']);}}}private function formaterBaseflor($reponse) {$description = "En cours de rédaction.";if (isset($reponse["nom_sci"]) && $reponse["nom_sci"] != "") {$description = "Formation végétale : ".$reponse["form_vegetale"]."; "."Inflorescence : ".$reponse["inflorescence"]."; "."Couleur de la fleur : ".$reponse["couleur_fleur"]."; "."Sexualité : ".$reponse["sexualite"]."; "."Fruit : ".$reponse["fruit"]."; "."Pollinisation : ".$reponse["pollinisation"]."; "."Dissémination : ".$reponse["dissemination"]."; "."Ecologie : ".$reponse["carac_ecolo"]." – "."Chorologie : ".$reponse["chorologie"]."; "."Floraison : ".$reponse["floraison"];}return $description;}private function consulterWebService($rest, $projet,$resssource,$parametres) {$url_id = "http://api.tela-botanica.org/service:eflore:0.1/".$projet."/".$resssource.$parametres;$reponse = $rest->consulter($url_id);return json_decode($reponse, true);}private function recupererContenuFichier() {$nomFichier = Config::get('dossierCsv').Config::get('projet');if ($nomFichier && file_exists($nomFichier) ){$extensionFichier = strtolower(strrchr($nomFichier, '.'));if ($extensionFichier === ".csv"){$file = new SplFileObject($nomFichier);$file->setFlags(SplFileObject::SKIP_EMPTY);$i = 0;echo "Traitement du fichier : ";while (!$file->eof()){$ligne_csv = $file->fgetcsv($delimiter = ';');$this->contenu_fichier[$i] = $ligne_csv;echo str_repeat(chr(8), ( strlen( $i ) + 1 ))."\t".$i++;}echo "\n";} else {$this->traiterErreur("Le fichier : $nomFichier n'est pas au format csv.");}} else {$this->traiterErreur("Le fichier : $nomFichier n'existe pas.");}}public function supprimerAccents($chaine) {return str_replace($this->caracteresAccentues, $this->caracteresNormaux, $chaine);}}?>