Subversion Repositories eFlore/Applications.cel

Rev

Rev 1675 | Rev 1678 | Go to most recent revision | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
1636 raphael 1
<?php
2
/**
3
* @category  PHP
4
* @package   jrest
5
* @author    Raphaël Droz <raphael@tela-botania.org>
6
* @copyright 2013 Tela-Botanica
7
* @license   http://www.cecill.info/licences/Licence_CeCILL_V2-fr.txt Licence CECILL
8
* @license GPL v3 <http://www.gnu.org/licenses/gpl.txt>
9
*/
10
 
11
/**
12
 * Service d'import de données d'observation du CEL au format XLS
1649 raphael 13
 *
14
 * Sont define()'d commme n° de colonne tous les abbrevs retournés par
1656 raphael 15
 * FormateurGroupeColonne::nomEnsembleVersListeColonnes() préfixés par C_  cf: detectionEntete()
1649 raphael 16
 *
17
 * Exemple d'un test:
18
 * $ GET "/jrest/ExportXLS/22506?format=csv&range=*&limite=13" \
19
 *   | curl -F "upload=@-" -F utilisateur=22506 "/jrest/ImportXLS"
20
 * # 13 observations importées
21
 * + cf MySQL general_log = 1
22
 *
23
 **/
1636 raphael 24
 
25
set_include_path(get_include_path() . PATH_SEPARATOR . dirname(dirname(realpath(__FILE__))) . '/lib');
26
// TERM
27
error_reporting(-1);
28
ini_set('html_errors', 0);
29
ini_set('xdebug.cli_color', 2);
30
require_once('lib/PHPExcel/Classes/PHPExcel.php');
1656 raphael 31
require_once('FormateurGroupeColonne.php');
1636 raphael 32
 
1640 raphael 33
 
34
date_default_timezone_set("Europe/Paris");
35
 
36
// nombre d'INSERT à cumuler par requête SQL
37
// (= nombre de lignes XLS à bufferiser)
1648 raphael 38
//define('NB_LIRE_LIGNE_SIMUL', 30);
39
define('NB_LIRE_LIGNE_SIMUL', 5);
1640 raphael 40
 
41
// Numbers of days between January 1, 1900 and 1970 (including 19 leap years)
42
// see traiterDateObs()
1675 raphael 43
// define("MIN_DATES_DIFF", 25569);
1640 raphael 44
 
45
 
1636 raphael 46
class MyReadFilter implements PHPExcel_Reader_IReadFilter {
1640 raphael 47
	// exclusion de colonnes
1638 raphael 48
	public $exclues = array();
1640 raphael 49
 
50
	// lecture par morceaux
51
    public $ligne_debut = 0;
52
    public $ligne_fin = 0;
53
 
1636 raphael 54
	public function __construct() {}
1640 raphael 55
	public function def_interval($debut, $nb) {
56
		$this->ligne_debut = $debut;
57
		$this->ligne_fin = $debut + $nb;
58
	}
1638 raphael 59
    public function readCell($colonne, $ligne, $worksheetName = '') {
60
		if(@$this->exclues[$colonne]) return false;
1640 raphael 61
		// si des n° de morceaux ont été initialisés, on filtre...
62
		if($this->ligne_debut && ($ligne < $this->ligne_debut || $ligne >= $this->ligne_fin)) return false;
1636 raphael 63
		return true;
64
    }
65
}
66
 
1675 raphael 67
// XXX: PHP 5.3
68
function __anonyme_1($v) {	return !$v['importable']; }
69
function __anonyme_2(&$v) {	$v = $v['nom']; }
70
function __anonyme_3($cell) { return !is_null($cell); };
71
function __anonyme_5($item) { return is_null($item) ? '?' : $item; }
72
function __anonyme_6() { return NULL; }
73
 
1636 raphael 74
class ImportXLS extends Cel  {
1677 raphael 75
	static function __anonyme_4($item, $key, $obj) { $item = $obj->quoteNonNull(trim($item)); }
1636 raphael 76
 
77
	static $ordre_BDD = Array(
78
		"ce_utilisateur",
79
		"prenom_utilisateur",
80
		"nom_utilisateur",
81
		"courriel_utilisateur",
82
		"ordre",
83
		"nom_sel",
84
		"nom_sel_nn",
85
		"nom_ret",
86
		"nom_ret_nn",
87
		"nt",
88
		"famille",
89
		"nom_referentiel",
90
		"zone_geo",
91
		"ce_zone_geo",
92
		"date_observation",
93
		"lieudit",
94
		"station",
95
		"milieu",
1649 raphael 96
		"mots_cles_texte",
1636 raphael 97
		"commentaire",
98
		"transmission",
99
		"date_creation",
100
		"date_modification",
1649 raphael 101
		"date_transmission",
1636 raphael 102
		"latitude",
1648 raphael 103
		"longitude",
1649 raphael 104
		"abondance",
105
		"certitude",
1648 raphael 106
		"phenologie",
107
		"code_insee_calcule"
108
	);
1636 raphael 109
 
1649 raphael 110
	// cf: initialiser_pdo_ordered_statements()
1648 raphael 111
	// eg: "INSERT INTO cel_obs (ce_utilisateur, ..., phenologie, code_insee_calcule) VALUES"
112
	// colonnes statiques d'abord, les autres ensuite, dans l'ordre de $ordre_BDD
113
	static $insert_prefix_ordre;
114
	// eg: "(<id>, <prenom>, <nom>, <email>, now(), now(), ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)"
115
	// dont le nombre de placeholder dépend du nombre de colonnes non-statiques
116
	// colonnes statiques d'abord, les autres ensuite, dans l'ordre de $ordre_BDD
117
	static $insert_ligne_pattern_ordre;
118
 
1649 raphael 119
	// seconde (meilleure) possibilité
120
	// cf: initialiser_pdo_statements()
121
	// eg: "INSERT INTO cel_obs (ce_utilisateur, ..., date_creation, ...phenologie, code_insee_calcule) VALUES"
122
	static $insert_prefix;
1648 raphael 123
	// eg: "(<id>, <prenom>, <nom>, <email>, ?, ?, ?, now(), now(), ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?)"
124
	// dont le nombre de placeholder dépend du nombre de colonnes non-statiques
125
	static $insert_ligne_pattern;
126
 
1640 raphael 127
	/*
128
	  Ces colonnes:
1642 raphael 129
	  - sont propres à l'ensemble des enregistrements uploadés
1640 raphael 130
	  - sont indépendantes du numéro de lignes
131
	  - n'ont pas de valeur par défaut dans la structure de la table
132
	  - nécessitent une initialisation dans le cadre de l'upload
1649 raphael 133
 
134
	  initialiser_colonnes_statiques() y merge les données d'identification utilisateur
1640 raphael 135
	*/
136
	public $colonnes_statiques = Array(
137
		"ce_utilisateur" => NULL,
138
		"prenom_utilisateur" => NULL,
139
		"nom_utilisateur" => NULL,
140
		"courriel_utilisateur" => NULL,
141
 
1642 raphael 142
		// fixes (fonction SQL)
143
		// XXX future: mais pourraient varier dans le futur si la mise-à-jour
1640 raphael 144
		// d'observation est implémentée
1642 raphael 145
		"date_creation" => "now()",
146
		"date_modification" => "now()",
1640 raphael 147
	);
148
 
1642 raphael 149
	public $id_utilisateur = NULL;
1649 raphael 150
 
1642 raphael 151
	// erreurs d'import
152
	public $bilan = Array();
153
 
1649 raphael 154
 
1636 raphael 155
	function ExportXLS($config) {
156
		parent::__construct($config);
157
	}
158
 
159
	function createElement($pairs) {
160
		if(!isset($pairs['utilisateur']) || trim($pairs['utilisateur']) == '') {
161
			echo '0'; exit;
162
		}
1649 raphael 163
 
1640 raphael 164
		$id_utilisateur = intval($pairs['utilisateur']);
1642 raphael 165
		$this->id_utilisateur = $id_utilisateur; // pour traiterImage();
1640 raphael 166
 
1636 raphael 167
		if(!isset($_SESSION)) session_start();
1640 raphael 168
        $this->controleUtilisateur($id_utilisateur);
1636 raphael 169
 
1640 raphael 170
        $this->utilisateur = $this->getInfosComplementairesUtilisateur($id_utilisateur);
1649 raphael 171
 
1640 raphael 172
		$this->initialiser_colonnes_statiques($id_utilisateur);
1636 raphael 173
 
1648 raphael 174
		// initialisation du statement PDO/MySQL
1649 raphael 175
		// première version, pattern de requête pas génial
176
		/* list(self;;$insert_prefix_ordre, self::$insert_ligne_pattern_ordre) =
177
		   $this->initialiser_pdo_ordered_statements($this->colonnes_statiques); */
178
		list(self::$insert_prefix, self::$insert_ligne_pattern) =
179
			$this->initialiser_pdo_statements($this->colonnes_statiques);
1640 raphael 180
 
1648 raphael 181
 
1636 raphael 182
		$infos_fichier = array_pop($_FILES);
183
 
184
		/*$objPHPExcel = PHPExcel_IOFactory::load($infos_fichier['tmp_name']);
1638 raphael 185
		  $donnees = $objPHPExcel->getActiveSheet()->toArray(NULL,FALSE,FALSE,TRUE);*/
1636 raphael 186
 
187
		/*$objReader = PHPExcel_IOFactory::createReader("Excel5");
188
		$objReader->setReadDataOnly(true);
189
		$objPHPExcel = $objReader->load($infos_fichier['tmp_name']);*/
190
 
1638 raphael 191
		//var_dump($donnees);
1636 raphael 192
 
1642 raphael 193
		// renomme le fichier pour lui ajouter son extension initiale, ce qui
194
		// permet (une sorte) d'autodétection du format.
195
		$fichier = $infos_fichier['tmp_name'];
196
		$extension = pathinfo($infos_fichier['name'], PATHINFO_EXTENSION);
197
		if( (strlen($extension) == 3 || strlen($extension) == 4) &&
198
			(rename($fichier, $fichier . '.' . $extension))) {
199
			$fichier = $fichier . '.' . $extension;
200
		}
201
 
202
		$objReader = PHPExcel_IOFactory::createReaderForFile($fichier);
1636 raphael 203
		$objReader->setReadDataOnly(true);
1640 raphael 204
 
1642 raphael 205
		if(is_a($objReader, 'PHPExcel_Reader_CSV')) {
206
			$objReader->setDelimiter(',')
207
				->setEnclosure('"')
208
				->setLineEnding("\n")
209
				->setSheetIndex(0);
210
		}
211
 
1640 raphael 212
		// on ne conserve que l'en-tête
213
		$filtre = new MyReadFilter();
214
		$filtre->def_interval(1, 2);
215
		$objReader->setReadFilter($filtre);
216
 
1642 raphael 217
		$objPHPExcel = $objReader->load($fichier);
218
		$obj_infos = $objReader->listWorksheetInfo($fichier);
1640 raphael 219
		// XXX: indépendant du readFilter ?
220
		$nb_lignes = $obj_infos[0]['totalRows'];
1636 raphael 221
 
1640 raphael 222
		$donnees = $objPHPExcel->getActiveSheet()->toArray(NULL, FALSE, FALSE, TRUE);
223
		$filtre->exclues = self::detectionEntete($donnees[1]);
1636 raphael 224
 
1640 raphael 225
		$obs_ajouts = 0;
226
		$obs_maj = 0;
1677 raphael 227
		$nb_images_ajoutees = 0;
228
		$nb_mots_cle_ajoutes = 0;
229
 
1640 raphael 230
		$dernier_ordre = $this->requeter("SELECT MAX(ordre) AS ordre FROM cel_obs WHERE ce_utilisateur = $id_utilisateur");
231
		$dernier_ordre = intval($dernier_ordre[0]['ordre']) + 1;
232
		if(! $dernier_ordre) $dernier_ordre = 0;
233
 
1642 raphael 234
		// on catch to les trigger_error(E_USER_NOTICE);
235
		set_error_handler(array($this, 'erreurs_stock'), E_USER_NOTICE);
236
 
1640 raphael 237
		// lecture par morceaux (chunks), NB_LIRE_LIGNE_SIMUL lignes à fois
238
		// pour aboutir des requêtes SQL d'insert groupés.
239
		for($ligne = 2; $ligne < $nb_lignes + NB_LIRE_LIGNE_SIMUL; $ligne += NB_LIRE_LIGNE_SIMUL) {
240
			$filtre->def_interval($ligne, NB_LIRE_LIGNE_SIMUL);
241
			$objReader->setReadFilter($filtre);
242
 
243
			/* recharge avec $filtre actif (filtre sur lignes colonnes):
244
			   - exclue les colonnes inutiles/inutilisables)
245
			   - ne selectionne que les lignes dans le range [$ligne - $ligne + NB_LIRE_LIGNE_SIMUL] */
1642 raphael 246
			$objPHPExcel = $objReader->load($fichier);
1640 raphael 247
			$donnees = $objPHPExcel->getActiveSheet()->toArray(NULL, FALSE, FALSE, TRUE);
248
 
249
			// ici on appel la fonction qui fera effectivement l'insertion multiple
250
			// à partir des (au plus) NB_LIRE_LIGNE_SIMUL lignes
251
 
1677 raphael 252
			// TODO: passer $this, ne sert que pour appeler des méthodes publiques qui pourraient être statiques
1640 raphael 253
			// notamment dans RechercheInfosTaxonBeta.php
1677 raphael 254
			list($enregistrements, $images, $mots_cle) =
1642 raphael 255
				self::chargerLignes($this, $donnees, $this->colonnes_statiques, $dernier_ordre);
256
			if(! $enregistrements) break;
257
 
1648 raphael 258
			self::trierColonnes($enregistrements);
259
			// normalement: NB_LIRE_LIGNE_SIMUL, sauf si une enregistrement ne semble pas valide
260
			// ou bien lors du dernier chunk
261
 
262
			$nb_rec = count($enregistrements);
263
			$sql_pattern = self::$insert_prefix .
264
				str_repeat(self::$insert_ligne_pattern_ordre . ', ', $nb_rec - 1) .
265
				self::$insert_ligne_pattern_ordre;
266
 
267
			$sql_pattern = self::$insert_prefix .
268
				str_repeat(self::$insert_ligne_pattern . ', ', $nb_rec - 1) .
269
				self::$insert_ligne_pattern;
270
 
271
			$this->bdd->beginTransaction();
272
			$stmt = $this->bdd->prepare($sql_pattern);
273
			$donnees = array();
274
			foreach($enregistrements as $e) $donnees = array_merge($donnees, array_values($e));
275
 
1677 raphael 276
			/* debug ici: */ echo $sql_pattern . "\n"; var_dump($enregistrements, $donnees); die;
1648 raphael 277
 
278
			$stmt->execute($donnees);
279
 
280
			// $stmt->debugDumpParams(); // https://bugs.php.net/bug.php?id=52384
281
			$dernier_autoinc = $this->bdd->lastInsertId();
1650 raphael 282
			$this->bdd->commit();
1648 raphael 283
 
1650 raphael 284
			if(! $dernier_autoinc) trigger_error("l'insertion semble avoir échoué", E_USER_NOTICE);
1648 raphael 285
 
1642 raphael 286
			$obs_ajouts += count($enregistrements);
1648 raphael 287
			// $obs_ajouts += count($enregistrements['insert']);
288
			// $obs_maj += count($enregistrements['update']);
1677 raphael 289
			$nb_images_ajoutees += self::stockerImages($this, $enregistrements, $images, $dernier_autoinc);
290
			$nb_mots_cle_ajoutes += self::stockerMotsCle($this, $enregistrements, $mots_cle, $dernier_autoinc);
1640 raphael 291
		}
1642 raphael 292
 
293
		restore_error_handler();
294
 
295
		if($this->bilan) echo implode("\n", $this->bilan) . "\n";
1650 raphael 296
 		$summary = sprintf("%d observation(s) ajoutée(s)\n%d image(s) attachée(s)",
297
						   $obs_ajouts,
298
						   $nb_images_ajoutees);
299
 
300
		die("$summary");
1636 raphael 301
	}
302
 
303
	static function detectionEntete($entete) {
304
		$colonnes_reconnues = Array();
1677 raphael 305
		$cols = FormateurGroupeColonne::nomEnsembleVersListeColonnes('standard'); // ,avance
1636 raphael 306
		foreach($entete as $k => $v) {
307
			$entete_simple = iconv('UTF-8', 'ASCII//TRANSLIT', strtolower(trim($v)));
308
			foreach($cols as $col) {
309
				$entete_officiel_simple = iconv('UTF-8', 'ASCII//TRANSLIT', strtolower(trim($col['nom'])));
1638 raphael 310
				$entete_officiel_abbrev = $col['abbrev'];
311
				if($entete_simple == $entete_officiel_simple || $entete_simple == $entete_officiel_abbrev) {
1648 raphael 312
					// debug echo "define C_" . strtoupper($entete_officiel_abbrev) . ", $k ($v)\n";
1638 raphael 313
					define("C_" . strtoupper($entete_officiel_abbrev), $k);
1636 raphael 314
					$colonnes_reconnues[$k] = 1;
315
					break;
316
				}
317
			}
318
		}
319
 
1640 raphael 320
		// prépare le filtre de PHPExcel qui évitera le traitement de toutes les colonnes superflues
321
 
322
		// eg: diff ( Array( H => Commune, I => rien ) , Array( H => 1, K => 1 )
323
		// ==> Array( I => rien )
1636 raphael 324
		$colonnesID_non_reconnues = array_diff_key($entete, $colonnes_reconnues);
325
 
1656 raphael 326
		// des colonnes de FormateurGroupeColonne::nomEnsembleVersListeColonnes()
1640 raphael 327
		// ne retient que celles marquées "importables"
1675 raphael 328
		$colonnes_automatiques = array_filter($cols, '__anonyme_1');
1640 raphael 329
 
1636 raphael 330
		// ne conserve que le nom long pour matcher avec la ligne XLS d'entête
1675 raphael 331
		array_walk($colonnes_automatiques, '__anonyme_2');
1640 raphael 332
 
333
		// intersect ( Array ( N => Milieu, S => Ordre ), Array ( ordre => Ordre, phenologie => Phénologie ) )
334
		// ==> Array ( S => Ordre, AA => Phénologie )
1636 raphael 335
		$colonnesID_a_exclure = array_intersect($entete, $colonnes_automatiques);
336
 
1640 raphael 337
		// TODO: pourquoi ne pas comparer avec les abbrevs aussi ?
338
		// merge ( Array( I => rien ) , Array ( S => Ordre, AA => Phénologie ) )
339
		// ==> Array ( I => rien, AA => Phénologie )
1636 raphael 340
		return array_merge($colonnesID_non_reconnues, $colonnesID_a_exclure);
341
	}
342
 
1640 raphael 343
	/*
344
	 * charge un groupe de lignes
345
	 */
1642 raphael 346
	static function chargerLignes($cel, $lignes, $colonnes_statiques, &$dernier_ordre) {
1640 raphael 347
		$enregistrement = NULL;
348
		$enregistrements = Array();
1642 raphael 349
		$toutes_images = Array();
1640 raphael 350
 
351
		foreach($lignes as $ligne) {
1642 raphael 352
			//$ligne = array_filter($ligne, function($cell) { return !is_null($cell); });
353
			//if(!$ligne) continue;
354
			// on a besoin des NULL pour éviter des notice d'index indéfini
1675 raphael 355
			if(! array_filter($ligne, '__anonyme_3')) continue;
1640 raphael 356
 
1642 raphael 357
			if( ($enregistrement = self::chargerLigne($ligne, $dernier_ordre, $cel)) ) {
1648 raphael 358
				// $enregistrements[] = array_merge($colonnes_statiques, $enregistrement);
359
				$enregistrements[] = $enregistrement;
1677 raphael 360
				$pos = count($enregistrements) - 1;
361
				$last = &$enregistrements[$pos];
1640 raphael 362
 
363
				if(isset($enregistrement['_images'])) {
364
					// ne dépend pas de cel_obs, et seront insérées *après* les enregistrements
365
					// mais nous ne voulons pas nous priver de faire des INSERT multiples pour autant
1642 raphael 366
					$toutes_images[] = Array("images" => $last['_images'],
367
											 "obs_pos" => $pos);
1677 raphael 368
					// ce champ n'a pas à faire partie de l'insertion dans cel_obs,
1640 raphael 369
					// mais est utile pour cel_obs_images
1642 raphael 370
					unset($last['_images']);
1640 raphael 371
				}
372
 
1677 raphael 373
				if(isset($enregistrement['_mots_cle'])) {
374
					// ne dépend pas de cel_obs, et seront insérés *après* les enregistrements
375
					// mais nous ne voulons pas nous priver de faire des INSERT multiples pour autant
376
					$tous_mots_cle[] = Array("mots_cle" => $last['_mots_cle'],
377
											 "obs_pos" => $pos);
378
					// la version inlinée des mots est enregistrées dans cel_obs
379
					// mais cel_mots_cles_obs fait foi.
380
					// XXX: postponer l'ajout de ces informations dans cel_obs *après* l'insertion effective
381
					// des records dans cel_mots_cles_obs ?
382
					$last[C_MOTS_CLES_TEXTE] = $last['_mots_cle']['inline_cel_obs'];
383
					unset($last['_mots_cle']);
384
				}
385
 
1640 raphael 386
				$dernier_ordre++;
387
			}
1636 raphael 388
		}
1640 raphael 389
 
1642 raphael 390
		// XXX future: return Array($enregistrements_a_inserer, $enregistrements_a_MAJ, $toutes_images);
1677 raphael 391
		return Array($enregistrements, $toutes_images, $tous_mots_cle);
1642 raphael 392
	}
1640 raphael 393
 
1642 raphael 394
 
1648 raphael 395
	static function trierColonnes(&$enregistrements) {
396
		foreach($enregistrements as &$enregistrement) {
1642 raphael 397
			$enregistrement = self::sortArrayByArray($enregistrement, self::$ordre_BDD);
1648 raphael 398
			//array_walk($enregistrement, function(&$item, $k) { $item = is_null($item) ? "NULL" : $item; });
399
			//$req .= implode(', ', $enregistrement) . "\n";
1642 raphael 400
		}
401
	}
402
 
403
 
1677 raphael 404
	static function stockerMotsCle($cel, $enregistrements, $tous_mots_cle, $lastid) {
405
		return count($tous_mots_cle);
406
	}
407
 
1642 raphael 408
	static function stockerImages($cel, $enregistrements, $toutes_images, $lastid) {
1650 raphael 409
		$images_insert = 'INSERT INTO cel_obs_images (id_image, id_observation) VALUES %s ON DUPLICATE KEY UPDATE id_image = id_image';
1642 raphael 410
		$images_obs_assoc = Array();
411
 
412
		foreach($toutes_images as $images_pour_obs) {
413
			$obs = $enregistrements[$images_pour_obs["obs_pos"]];
1640 raphael 414
			$id_obs = $lastid // dernier autoinc inséré
1650 raphael 415
				- count($enregistrements) + 1 // correspondrait au premier autoinc
416
				+ $images_pour_obs["obs_pos"]; // ordre d'insertion = ordre dans le tableau $enregistrements (commence à 0)
1642 raphael 417
			foreach($images_pour_obs['images'] as $image) {
418
				$images_obs_assoc[] = sprintf('(%d,%d)',
419
											  $image['id_image'], // intval() useless
420
											  $id_obs); // intval() useless
421
			}
1640 raphael 422
		}
1642 raphael 423
 
424
		if($images_obs_assoc) {
425
			$requete = sprintf($images_insert, implode(', ', $images_obs_assoc));
1650 raphael 426
			// debug echo "$requete\n";
427
			$cel->requeter($requete);
1642 raphael 428
		}
1650 raphael 429
 
430
		return count($images_obs_assoc);
1636 raphael 431
	}
432
 
1649 raphael 433
	/*
434
	  Aucune des valeurs présentes dans $enregistrement n'est quotée
435
	  cad aucune des valeurs retournée par traiter{Espece|Localisation}()
436
	  car ce tableau est passé à un PDO::preparedStatement() qui applique
437
	  proprement les règle d'échappement.
438
	 */
1642 raphael 439
	static function chargerLigne($ligne, $dernier_ordre, $cel) {
1636 raphael 440
		// en premier car le résultat est utile pour
441
		// traiter longitude et latitude (traiterLonLat())
1640 raphael 442
		$referentiel = self::identReferentiel($ligne[C_NOM_REFERENTIEL]);
1636 raphael 443
 
1640 raphael 444
		// $espece est rempli de plusieurs informations
1642 raphael 445
		$espece = Array(C_NOM_SEL => NULL, C_NOM_SEL_NN => NULL, C_NOM_RET => NULL,
446
						C_NOM_RET_NN => NULL, C_NT => NULL, C_FAMILLE => NULL);
1640 raphael 447
		self::traiterEspece($ligne, $espece, $cel);
1636 raphael 448
 
1642 raphael 449
		// $localisation est rempli à partir de plusieurs champs: C_ZONE_GEO et C_CE_ZONE_GEO
450
		$localisation = Array(C_ZONE_GEO => NULL, C_CE_ZONE_GEO => NULL);
451
		self::traiterLocalisation($ligne, $localisation, $cel);
1636 raphael 452
 
1649 raphael 453
		// $transmission est utilisé pour date_transmission
1675 raphael 454
		// XXX: @ contre "Undefined index"
455
		@$transmission = in_array(strtolower(trim($ligne[C_TRANSMISSION])), array(1, 'oui')) ? 1 : 0;
1649 raphael 456
 
457
 
1642 raphael 458
		// Dans ce tableau, seules devraient apparaître les données variable pour chaque ligne.
459
		// Dans ce tableau, l'ordre des clefs n'importe pas (cf: self::sortArrayByArray())
460
		$enregistrement = Array(
461
			"ordre" => $dernier_ordre,
1640 raphael 462
 
1642 raphael 463
			"nom_sel" => $espece[C_NOM_SEL],
464
			"nom_sel_nn" => $espece[C_NOM_SEL_NN],
465
			"nom_ret" => $espece[C_NOM_RET],
466
			"nom_ret_nn" => $espece[C_NOM_RET_NN],
467
			"nt" => $espece[C_NT],
468
			"famille" => $espece[C_FAMILLE],
1640 raphael 469
 
1649 raphael 470
			"nom_referentiel" => $referentiel,
1640 raphael 471
 
1642 raphael 472
			"zone_geo" => $localisation[C_ZONE_GEO],
473
			"ce_zone_geo" => $localisation[C_CE_ZONE_GEO],
1640 raphael 474
 
1642 raphael 475
			// $ligne: uniquement pour les infos en cas de gestion d'erreurs (date incompréhensible)
1649 raphael 476
			"date_observation" => self::traiterDateObs($ligne[C_DATE_OBSERVATION], $ligne),
1640 raphael 477
 
1649 raphael 478
			"lieudit" => trim($ligne[C_LIEUDIT]),
479
			"station" => trim($ligne[C_STATION]),
480
			"milieu" => trim($ligne[C_MILIEU]),
1642 raphael 481
 
1649 raphael 482
			"mots_cles_texte" => NULL, // TODO: foreign-key
1675 raphael 483
			// XXX: @ contre "Undefined index"
484
			"commentaire" => @trim($ligne[C_COMMENTAIRE]),
1642 raphael 485
 
1649 raphael 486
			"transmission" => $transmission,
487
			"date_transmission" => $transmission ? date("Y-m-d H:i:s") : NULL, // pas de fonction SQL dans un PDO statement, <=> now()
1642 raphael 488
 
489
			// $ligne: uniquement pour les infos en cas de gestion d'erreurs (lon/lat incompréhensible)
490
			"latitude" => self::traiterLonLat(NULL, $ligne[C_LATITUDE], $referentiel, $ligne),
491
			"longitude" => self::traiterLonLat($ligne[C_LONGITUDE], NULL, $referentiel, $ligne),
1648 raphael 492
 
493
			// @ car potentiellement optionnelles ou toutes vides => pas d'index dans PHPExcel (tableau optimisé)
494
			"abondance" => @$ligne[C_ABONDANCE],
495
			"certitude" => @$ligne[C_CERTITUDE],
496
			"phenologie" => @$ligne[C_PHENOLOGIE],
497
 
1649 raphael 498
			"code_insee_calcule" => substr($localisation[C_CE_ZONE_GEO], -5) // varchar(5)
1642 raphael 499
		);
500
 
501
		// passage de $enregistrement par référence, ainsi ['_images'] n'est défini
502
		// que si des résultats sont trouvés
503
		// "@" car PHPExcel supprime les colonnes null sur toute la feuille (ou tout le chunk)
504
		if(@$ligne[C_IMAGES]) self::traiterImage($ligne[C_IMAGES], $cel, $enregistrement);
505
 
1677 raphael 506
		if(@$ligne[C_MOTS_CLES_TEXTE]) self::traiterMotsCle($ligne[C_MOTS_CLES_TEXTE], $cel, $enregistrement);
507
 
1642 raphael 508
		return $enregistrement;
1636 raphael 509
	}
510
 
1642 raphael 511
	static function traiterImage($str, $cel, &$enregistrement) {
512
		$liste_images = array_filter(explode("/", $str));
1675 raphael 513
 
1677 raphael 514
		//array_walk($liste_images, '__anonyme_4', $cel);
515
		array_walk($liste_images, array(__CLASS__, '__anonyme_4'), $cel);
1642 raphael 516
		$requete = sprintf(
517
			"SELECT id_image, nom_original FROM cel_images WHERE ce_utilisateur = %d AND nom_original IN (\"%s\")",
518
			$cel->id_utilisateur,
519
			implode('","', $liste_images));
1640 raphael 520
 
1642 raphael 521
		$resultat = $cel->requeter($requete);
1640 raphael 522
 
1642 raphael 523
		if($resultat) $enregistrement['_images'] = $resultat;
524
	}
525
 
1677 raphael 526
	static function traiterMotsCle($str, $cel, &$enregistrement) {
527
		$liste_mots_cle = array_filter(explode(",", $str));
528
		array_walk($liste_mots_cle, array(__CLASS__, '__anonyme_4'), $cel);
529
		// TODO!!!! remplace > (pour les tests uniquement) par un = et supprimer le group by mot_cle
530
		$requete = sprintf("SELECT id_mot_cle_obs, mot_cle FROM cel_mots_cles_obs WHERE id_utilisateur > %d ".
531
						   "AND mot_cle IN (\"%s\") ".
532
						   "GROUP BY mot_cle",
533
						   $cel->id_utilisateur,
534
						   implode('","', $liste_mots_cle));
1642 raphael 535
 
1677 raphael 536
		$resultat_sql = $cel->requeter($requete);
537
		if(!$resultat_sql) return;
538
 
539
		$resultat = array();
540
		foreach($resultat_sql as $v) $resultat[$v['id_mot_cle_obs']] = $v['mot_cle'];
541
 
542
		$enregistrement['_mots_cle'] = array("inline_cel_obs" => implode(',', $liste_mots_cle),
543
											 "existing" => $resultat,
544
											 "to_insert" => $liste_mots_cle);
545
	}
546
 
547
 
1640 raphael 548
	/* FONCTIONS de TRANSFORMATION de VALEUR DE CELLULE */
549
 
550
	// TODO: PHP 5.3, utiliser date_parse_from_format()
551
	// TODO: parser les heures (cf product-owner)
552
	// TODO: passer par le timestamp pour s'assurer de la validité
1642 raphael 553
	static function traiterDateObs($date, $ligne) {
1640 raphael 554
		// TODO: see https://github.com/PHPOffice/PHPExcel/issues/208
555
		if(is_double($date)) {
556
			if($date > 0)
557
				return PHPExcel_Style_NumberFormat::toFormattedString($date, PHPExcel_Style_NumberFormat::FORMAT_DATE_YYYYMMDD2) . " 00:00:00";
1642 raphael 558
			trigger_error("ligne \"{$ligne[C_NOM_SEL]}\": " .
559
						  "Attention: date antérieure à 1970 et format de cellule \"DATE\" utilisés ensemble",
560
						  E_USER_NOTICE);
561
 
562
			// throw new Exception("erreur: date antérieure à 1970 et format de cellule \"DATE\" utilisés ensemble");
1640 raphael 563
 
564
			// attention, UNIX timestamp, car Excel les décompte depuis 1900
565
			// cf http://fczaja.blogspot.fr/2011/06/convert-excel-date-into-timestamp.html
566
			// $timestamp = ($date - MIN_DATES_DIFF) * 60 * 60 * 24 - time(); // NON
567
 
568
			// $timestamp = PHPExcel_Calculation::getInstance()->calculateFormula("=" . $date . "-DATE(1970,1,1)*60*60*24"); // NON
569
 
570
			// echo strftime("%Y/%m/%d 00:00:00", $timestamp); // NON
571
		}
572
		else {
573
			$timestamp = strtotime($date);
1642 raphael 574
			if(! $timestamp) {
575
				if($date) trigger_error("ligne \"{$ligne[C_NOM_SEL]}\": Attention: date erronée ($date)", E_USER_NOTICE);
576
				return NULL;
577
			}
1640 raphael 578
			return strftime("%Y-%m-%d 00:00:00", strtotime($date));
579
		}
1636 raphael 580
	}
581
 
582
	static function identReferentiel($referentiel) {
1640 raphael 583
		// SELECT DISTINCT nom_referentiel, COUNT(id_observation) AS count FROM cel_obs GROUP BY nom_referentiel ORDER BY count DESC;
584
		if(strpos(strtolower($referentiel), 'bdtfx') !== FALSE) return 'bdtfx:v1.01';
585
		if(strpos(strtolower($referentiel), 'bdtxa') !== FALSE) return 'bdtxa:v1.00';
586
		if(strpos(strtolower($referentiel), 'bdnff') !== FALSE) return 'bdnff:4.02';
587
		if(strpos(strtolower($referentiel), 'isfan') !== FALSE) return 'isfan:v1.00';
1642 raphael 588
 
589
		if($referentiel) {
590
			trigger_error("ligne \"{$ligne[C_NOM_SEL]}\": Attention: référentiel inconnu", E_USER_NOTICE);
591
		}
1640 raphael 592
		return NULL;
593
		/* TODO: cf story,
1642 raphael 594
		   En cas de NULL faire une seconde passe de détection à partir du nom saisi
595
		   + accepter les n° de version */
1636 raphael 596
	}
597
 
1642 raphael 598
	static function traiterLonLat($lon = NULL, $lat = NULL, $referentiel = 'bdtfx:v1.01', $ligne) {
599
		// en CSV ces valeurs sont des string, avec séparateur en français (","; cf défauts dans ExportXLS)
600
		if($lon && is_string($lon)) $lon = str_replace(',', '.', $lon);
601
		if($lat && is_string($lat)) $lat = str_replace(',', '.', $lat);
1640 raphael 602
 
1642 raphael 603
		// sprintf applique une précision à 5 décimale (comme le ferait MySQL)
604
		// tout en uniformisant le format de séparateur des décimales (le ".")
605
		if($lon && is_numeric($lon) && $lon >= -180 && $lon <= 180) return sprintf('%.5F', $lon);
606
		if($lat && is_numeric($lat) && $lat >= -90 && $lat <= 90) return sprintf('%.5F', $lat);
607
 
608
		if($lon || $lat) {
609
			trigger_error("ligne \"{$ligne[C_NOM_SEL]}\": " .
610
						  "Attention: longitude ou latitude erronée",
611
						  E_USER_NOTICE);
612
		}
613
		return NULL;
614
 
615
		/* limite france métropole si bdtfx ? ou bdtxa ? ...
616
		   NON!
617
		   Un taxon d'un référentiel donné peut être théoriquement observé n'importe où sur le globe.
618
		   Il n'y a pas lieu d'effectuer des restriction ici.
619
		   Cependant des erreurs fréquentes (0,0 ou lon/lat inversées) peuvent être détectés ici.
620
		   TODO */
1640 raphael 621
		$bbox = self::getReferentielBBox($referentiel);
622
		if(!$bbox) return NULL;
623
 
624
		if($lon) {
625
			if($lon < $bbox['EST'] && $lon > $bbox['OUEST']) return is_numeric($lon) ? $lon : NULL;
626
			else return NULL;
627
		}
628
		if($lat) {
629
			if($lat < $bbox['NORD'] && $lat > $bbox['SUD']) return is_numeric($lat) ? $lat : NULL;
630
			return NULL;
631
		}
1636 raphael 632
	}
633
 
1640 raphael 634
 
635
	static function traiterEspece($ligne, Array &$espece, $cel) {
1642 raphael 636
		if(!$ligne[C_NOM_SEL]) return;
637
 
1651 raphael 638
		// nom_sel reste toujours celui de l'utilisateur
639
		$espece[C_NOM_SEL] = trim($ligne[C_NOM_SEL]);
640
 
1640 raphael 641
		$taxon_info_webservice = new RechercheInfosTaxonBeta($cel->config);
642
 
643
		$ascii = iconv('UTF-8', 'ASCII//TRANSLIT', $ligne[C_NOM_SEL]);
1651 raphael 644
 
645
		// TODO: si empty(C_NOM_SEL) et !empty(C_NOM_SEL_NN) : recherche info à partir de C_NOM_SEL_NN
1640 raphael 646
		$resultat_recherche_espece = $taxon_info_webservice->rechercherInfosSurTexteCodeOuNumTax($ligne[C_NOM_SEL]);
647
 
648
		// on supprime les noms retenus et renvoi tel quel
649
		// on réutilise les define pour les noms d'indexes, tant qu'à faire
650
		if (empty($resultat_recherche_espece['en_id_nom'])) {
1651 raphael 651
			// XXX; tout à NULL sauf C_NOM_SEL ci-dessus ?
1642 raphael 652
			$espece[C_NOM_SEL_NN] = $ligne[C_NOM_SEL_NN];
1640 raphael 653
			$espece[C_NOM_RET] = $ligne[C_NOM_RET];
654
			$espece[C_NOM_RET_NN] = $ligne[C_NOM_RET_NN];
655
			$espece[C_NT] = $ligne[C_NT];
656
			$espece[C_FAMILLE] = $ligne[C_FAMILLE];
657
 
658
			return;
659
		}
660
 
1651 raphael 661
		// succès de la détection = écrasement du numéro nomenclatural saisi...
1649 raphael 662
		$espece[C_NOM_SEL_NN] = $resultat_recherche_espece['en_id_nom'];
1651 raphael 663
		// et des info complémentaires
1640 raphael 664
		$complement = $taxon_info_webservice->rechercherInformationsComplementairesSurNumNom($resultat_recherche_espece['en_id_nom']);
1649 raphael 665
		$espece[C_NOM_RET] = $complement['Nom_Retenu'];
666
		$espece[C_NOM_RET_NN] = $complement['Num_Nom_Retenu'];
667
		$espece[C_NT] = $complement['Num_Taxon'];
668
		$espece[C_FAMILLE] = $complement['Famille'];
1640 raphael 669
	}
670
 
671
 
1642 raphael 672
	static function traiterLocalisation($ligne, Array &$localisation, $cel) {
673
	    $identifiant_commune = trim($ligne[C_ZONE_GEO]);
674
		if(!$identifiant_commune) {
675
			$departement = trim($ligne[C_CE_ZONE_GEO]);
676
			goto testdepartement;
677
		}
678
 
679
 
680
		$select = "SELECT DISTINCT nom, code  FROM cel_zones_geo";
681
 
682
		if (preg_match('/(.*) \((\d+)\)/', $identifiant_commune, $elements)) {
683
			// commune + departement : montpellier (34)
684
			$nom_commune=$elements[1];
685
			$code_commune=$elements[2];
686
	 	    $requete = sprintf("%s WHERE nom = %s AND code LIKE %s",
1649 raphael 687
							   $select, $cel->quoteNonNull($nom_commune), $cel->quoteNonNull($code_commune.'%'));
1642 raphael 688
		}
689
		elseif (preg_match('/^(\d+|(2[ab]\d+))$/i', $identifiant_commune, $elements)) {
690
			// Code insee seul
691
			$code_insee_commune=$elements[1];
1649 raphael 692
	 	    $requete = sprintf("%s WHERE code = %s", $select, $cel->quoteNonNull($code_insee_commune));
1642 raphael 693
		}
694
		else {
695
			// Commune seule (le departement sera recupere dans la colonne departement si elle est presente)
696
			// on prend le risque ici de retourner une mauvaise Commune
697
			$nom_commune = str_replace(" ", "%", iconv('UTF-8', 'ASCII//TRANSLIT', $identifiant_commune));
1649 raphael 698
	 	    $requete = sprintf("%s WHERE nom LIKE %s", $select, $cel->quoteNonNull($nom_commune.'%'));
1642 raphael 699
		}
700
 
701
		$resultat_commune = $cel->requeter($requete);
702
		// TODO: levenstein sort ?
703
 
704
		// cas de la commune introuvable dans le référentiel
705
		// réinitialisation aux valeurs du fichier XLS
706
		if(! $resultat_commune) {
707
			$localisation[C_ZONE_GEO] = trim($ligne[C_ZONE_GEO]);
708
			$localisation[C_CE_ZONE_GEO] = trim($ligne[C_CE_ZONE_GEO]);
709
		} else {
710
			$localisation[C_ZONE_GEO] = $resultat_commune[0]['nom'];
711
			$localisation[C_CE_ZONE_GEO] = $resultat_commune[0]['code'];
712
		}
713
 
714
		$departement = &$localisation[C_CE_ZONE_GEO];
715
 
716
	testdepartement:
717
		if(strpos($departement, "INSEE-C:", 0) === 0) goto protectloc;
718
 
719
		if(!is_numeric($departement)) goto protectloc; // TODO ?
720
		if(strlen($departement) == 4) $departement = "INSEE-C:0" . $departement;
721
		if(strlen($departement) == 5) $departement = "INSEE-C:" . $departement;
1640 raphael 722
		// if(strlen($departement) <= 9) return "INSEE-C:0" . $departement; // ? ... TODO
1642 raphael 723
 
724
		$departement = trim($departement); // TODO
725
 
726
	protectloc:
1649 raphael 727
		$localisation[C_ZONE_GEO] = $localisation[C_ZONE_GEO];
728
		$localisation[C_CE_ZONE_GEO] = $localisation[C_CE_ZONE_GEO];
1640 raphael 729
	}
730
 
731
 
1642 raphael 732
 
1640 raphael 733
	/* HELPERS */
734
 
1636 raphael 735
	// http://stackoverflow.com/questions/348410/sort-an-array-based-on-another-array
1640 raphael 736
	static function sortArrayByArray($array, $orderArray) {
1636 raphael 737
		$ordered = array();
738
		foreach($orderArray as $key) {
739
			if(array_key_exists($key, $array)) {
740
				$ordered[$key] = $array[$key];
741
				unset($array[$key]);
742
			}
743
		}
744
		return $ordered + $array;
745
	}
1640 raphael 746
 
747
	// retourne une BBox [N,S,E,O) pour un référentiel donné
748
	static function getReferentielBBox($referentiel) {
749
		if($referentiel == 'bdtfx:v1.01') return Array(
750
			'NORD' => 51.2, // Dunkerque
751
			'SUD' => 41.3, // Bonifacio
752
			'EST' => 9.7, // Corse
753
			'OUEST' => -5.2); // Ouessan
754
		return FALSE;
755
	}
756
 
1649 raphael 757
	// ces valeurs ne sont pas inséré via les placeholders du PDO::preparedStatement
758
	// et doivent donc être échappées correctement.
1642 raphael 759
	public function initialiser_colonnes_statiques() {
1640 raphael 760
		$this->colonnes_statiques = array_merge($this->colonnes_statiques,
761
												Array(
1642 raphael 762
													"ce_utilisateur" => $this->id_utilisateur,
1649 raphael 763
													"prenom_utilisateur" => $this->quoteNonNull($this->utilisateur['prenom']),
764
													"nom_utilisateur" => $this->quoteNonNull($this->utilisateur['nom']),
765
													"courriel_utilisateur" => $this->quoteNonNull($this->utilisateur['courriel']),
1640 raphael 766
												));
767
 
768
	}
1642 raphael 769
 
1649 raphael 770
	static function initialiser_pdo_ordered_statements($colonnes_statiques) {
771
		return Array(
772
			// insert_ligne_pattern_ordre
773
			sprintf('INSERT INTO cel_obs (%s, %s) VALUES',
774
					implode(', ', array_keys($colonnes_statiques)),
775
					implode(', ', array_diff(self::$ordre_BDD, array_keys($colonnes_statiques)))),
776
 
777
			// insert_ligne_pattern_ordre
778
			sprintf('(%s, %s ?)',
779
					implode(', ', $colonnes_statiques),
780
					str_repeat('?, ', count(self::$ordre_BDD) - count($colonnes_statiques) - 1))
781
		);
1648 raphael 782
	}
783
 
1649 raphael 784
	static function initialiser_pdo_statements($colonnes_statiques) {
785
		return Array(
786
			// insert_prefix
787
			sprintf('INSERT INTO cel_obs (%s) VALUES ',
788
					implode(', ', self::$ordre_BDD)),
789
 
1650 raphael 790
 
791
			// insert_ligne_pattern, cf: self::$insert_ligne_pattern
1649 raphael 792
			'(' .
1650 raphael 793
			// 3) créé une chaîne de liste de champ à inséré en DB
794
			implode(', ', array_values(
795
				// 2) garde les valeurs fixes (de $colonnes_statiques),
796
				// mais remplace les NULL par des "?"
1675 raphael 797
				array_map('__anonyme_5',
1650 raphael 798
						  // 1) créé un tableau genre (nom_sel_nn => NULL) depuis self::$ordre_BDD
799
						  // et écrase certaines valeurs avec $colonnes_statiques (initilisé avec les données utilisateur)
1675 raphael 800
						  array_merge(array_map('__anonyme_6', array_flip(self::$ordre_BDD)), $colonnes_statiques
1649 raphael 801
				)))) .
802
			')'
803
		);
804
	}
805
 
1642 raphael 806
	// équivalent à CEL->Bdd->proteger() (qui wrap PDO::quote),
807
	// sans transformer NULL en ""
808
	private function quoteNonNull($chaine) {
809
		if(is_null($chaine)) return "NULL";
810
		if(!is_string($chaine)) die("erreur __FILE__, __LINE__");
811
		return $this->bdd->quote($chaine);
812
	}
813
 
814
	public function erreurs_stock($errno, $errstr) {
815
		$this->bilan[] = $errstr;
816
	}
1636 raphael 817
}