Subversion Repositories eFlore/Applications.cel

Rev

Rev 2031 | Go to most recent revision | Details | Compare with Previous | Last modification | View Log | RSS feed

Rev Author Line No. Line
2031 aurelien 1
<?php
2
// Encodage : UTF-8
3
// +-------------------------------------------------------------------------------------------------------------------+
4
/**
5
 * Traitement des mots clés cel pour les migrer vers des mots clés stockés avec path enumeration
6
 *
7
 * Description : classe de migration vers des mots clés stockés avec path enumeration
8
 * Utilisation : php script.php migrationmotsclees -a obs
9
 *  * Utilisation : php script.php migrationmotsclees -a images
10
 *
11
 * @category		PHP 5.3
12
 * @package		scripts
13
 //Auteur original :
14
 * @author		Aurélien PERONNET <aurelien@tela-botanica.org>
15
 * @copyright	Copyright (c) 2009, Tela Botanica (accueil@tela-botanica.org)
16
 * @license		http://www.gnu.org/licenses/gpl.html Licence GNU-GPL-v3
17
 * @license		http://www.cecill.info/licences/Licence_CeCILL_V2-fr.txt Licence CECILL-v2
18
 * @version		$Id$
19
 */
20
// +-------------------------------------------------------------------------------------------------------------------+
21
class Migrationmotscles extends Script {
22
 
23
	private $mode;
24
 
25
	// +-------------------------------------------------------------------------------------------------------------------+
26
	public function executer() {
27
		include_once dirname(__FILE__).'/bibliotheque/Dao.php';
28
 
29
		$cmd = $this->getParametre('a');
30
		$this->mode_verbeux = $this->getParametre('v');
31
 
32
		switch($cmd) {
33
			case 'obs':
34
				$this->mode = $cmd;
35
				$this->migrerMotsClesObservations();
36
			break;
37
 
38
			case 'images':
39
				$this->mode = $cmd;
40
				$this->migrerMotsClesImages();
41
			break;
42
 
43
			default:
44
				echo 'Méthode inconnue, les méthodes possibles sont obs et images'."\n";
45
		}
46
	}
47
 
48
	private function migrerMotsClesObservations() {
49
		$this->dao = new Dao('obs');
50
		$this->convertirNestedSetVersPathEnum();
51
	}
52
 
53
	private function migrerMotsClesImages() {
54
		$this->dao = new Dao('images');
55
		$this->convertirNestedSetVersPathEnum();
56
	}
57
 
58
	private function convertirNestedSetVersPathEnum() {
59
 
60
		$debut = microtime();
61
 
62
		$this->dao->viderTables();
63
 
64
		$mots_cles_hierarchiques = $this->dao->obtenirMotsClesOriginaux($this->mode);
65
		$mots_cles_hierarchiques = $this->formaterChemin($mots_cles_hierarchiques);
66
 
67
		$liaisons = $this->dao->obtenirLiaisonsMotsClesOriginaux($this->mode);
68
 
69
		if($this->mode_verbeux) {
70
			echo "-------------------------------------------------------------------\n";
71
			echo " Début de la migration des mots clés ".$this->mode." \n";
72
			echo " ".count($mots_cles_hierarchiques)." mots clés et ".count($liaisons)." liaisons à migrer \n";
73
			echo "-------------------------------------------------------------------\n";
74
		}
75
 
76
		$nb_mots_cles = 0;
77
		$nb_liaisons = 0;
78
 
79
		$mots_cles_slice = array_chunk($mots_cles_hierarchiques, 800, true);
80
		echo " Insertion des mots clés par paquet de 800 \n";
81
		foreach($mots_cles_slice as &$mots_cles_tranche) {
82
			$this->dao->insererMotsCles(&$mots_cles_tranche);
83
			$nb_mots_cles += 800;
84
			if($this->mode_verbeux) {
85
				$this->afficherAvancement(' mots clés insérés ', $nb_mots_cles);
86
			}
87
		}
2057 aurelien 88
		echo "\n Insertion des mots clés ".$this->mode." terminée \n";
2031 aurelien 89
 
90
		$infos_nouveaux_mots_cles = $this->dao->obtenirInfosNouveauxMotsCles();
91
		$correspondances = $this->formaterCorrespondanceCheminId($infos_nouveaux_mots_cles);
92
 
93
		$liaisons_slice = array_chunk($liaisons, 800, true);
94
		echo " Insertion des mots liaisons par paquet de 800 \n";
95
		foreach($liaisons_slice as &$liaison_tranche) {
96
			$this->dao->insererLiaisonsMotsCles(&$mots_cles_hierarchiques, &$liaison_tranche, &$correspondances);
97
			$nb_liaisons += 800;
98
			if($this->mode_verbeux) {
99
				$this->afficherAvancement(' liaisons insérées ', $nb_liaisons);
100
			}
101
		}
102
		echo "\n Insertion des liaisons ".$this->mode." terminée \n";
103
 
104
		$fin = microtime(true);
105
		if($this->mode_verbeux) {
106
			echo "\n";
107
			echo "-------------------------------------------------------------------\n";
108
			echo "  Fin de la migration des mots clés ".$this->mode.", \n";
109
			echo "  ".($fin - $debut)." secondes écoulées \n";
110
			echo "  ".count($mots_cles_hierarchiques)." mots clés insérés \n";
111
			echo "  ".count($liaisons)." liaisons insérées \n";
112
			echo "-------------------------------------------------------------------\n";
113
			echo "\n";
114
		}
115
	}
116
 
117
	private function formaterCorrespondanceCheminId($infos_nouveaux_mots_cles) {
118
		$mots_cles_correspondances = array();
119
		foreach($infos_nouveaux_mots_cles as &$mot) {
120
			$cle = $mot['chemin'].'-'.$mot['id_utilisateur'];
121
			$mots_cles_correspondances[$cle] = $mot;
122
		}
123
		return $mots_cles_correspondances;
124
	}
125
 
126
	private function formaterChemin($mots_cles) {
127
		$mots_cles_hierarchiques = array();
128
		$chemin_traites = array();
129
		$pbs = array('doublons' => array(), 'vides' => array());
130
 
131
		foreach($mots_cles as &$mot) {
132
 
133
			if(trim($mot['mot_cle']) != "") {
134
				$chemin = '/';
135
				$cle_parent = $mot['parent'].'-'.$mot['id_utilisateur'];
136
				if(isset($mots_cles_hierarchiques[$cle_parent])) {
137
					$chemin = $mots_cles_hierarchiques[$cle_parent]['chemin'];
138
				}
139
				$chemin .= self::simplifier($mot['mot_cle']).'/';
140
				$chemin = str_replace("//", "/", $chemin);
141
 
142
				if(!isset($chemin_traites[self::harmoniserPourDoublon($chemin).'-'.$mot['id_utilisateur']])) {
143
					$cle = $mot['id_mot_cle'].'-'.$mot['id_utilisateur'];
144
 
145
					$mots_cles_hierarchiques[$cle] = array(
146
												'id_utilisateur' => $mot['id_utilisateur'],
147
												'chemin' => $chemin,
2057 aurelien 148
												'mot_cle' => $mot['mot_cle']
2031 aurelien 149
					);
150
					$chemin_traites[self::harmoniserPourDoublon($chemin).'-'.$mot['id_utilisateur']] = 1;
151
				} else {
152
					$pbs['doublons'][self::harmoniserPourDoublon($chemin).'-'.$mot['id_utilisateur']] = $mot;
153
				}
154
			} else {
155
				$pbs['vides'][] = $mot;
156
			}
157
		}
2057 aurelien 158
 
159
		//echo '<pre>'.print_r($mots_cles_hierarchiques,true).'</pre>';exit;
2031 aurelien 160
		return $mots_cles_hierarchiques;
161
	}
162
 
163
	static public function harmoniserPourDoublon($texte) {
164
		$texte = htmlentities($texte, ENT_NOQUOTES, 'utf-8');
165
		$texte = preg_replace('/&([A-za-z])(?:acute|cedil|circ|grave|orn|ring|slash|th|tilde|uml);/', '\1', $texte);
166
		$texte = preg_replace('/&([A-za-z]{2})(?:lig);/', '\1', $texte); // pour les ligatures e.g. '&oelig;'
167
		$texte = preg_replace('/&[^;]+;/', '', $texte); // supprime les autres caractères
168
 
169
		return strtolower($texte);
170
	}
171
 
172
	static public function simplifier($text) {
173
		// le slash est le seul caractère interdit dans les mots clés
174
		return trim(str_replace(array('\\','/'), '', $text));
175
	}
176
}
177
?>