Subversion Repositories Applications.wikini

Rev

Rev 72 | Only display areas with differences | Ignore whitespace | Details | Blame | Last modification | View Log | RSS feed

Rev 72 Rev 74
1
<?php
1
<?php
2
// declare(encoding='UTF-8');
2
// declare(encoding='UTF-8');
3
/**
3
/**
4
 *
4
 *
5
 * @category   wiki/smart'Flore
5
 * @category   wiki/smart'Flore
6
 * @package    Scripts
6
 * @package    Scripts
7
 * @author     Aurelien PERONNET <aurelien@tela-botanica.org>
7
 * @author     Aurelien PERONNET <aurelien@tela-botanica.org>
8
 * @license    GPL v3 <http://www.gnu.org/licenses/gpl.txt>
8
 * @license    GPL v3 <http://www.gnu.org/licenses/gpl.txt>
9
 * @license    CECILL v2 <http://www.cecill.info/licences/Licence_CeCILL_V2-en.txt>
9
 * @license    CECILL v2 <http://www.cecill.info/licences/Licence_CeCILL_V2-en.txt>
10
 * @copyright  1999-2015 Tela Botanica <accueil@tela-botanica.org>
10
 * @copyright  1999-2015 Tela Botanica <accueil@tela-botanica.org>
11
 */
11
 */
12
 
12
 
13
class MigrationSmartFlore extends Script {
13
class MigrationSmartFlore extends Script {
14
 
14
 
15
	protected $mode_verbeux = false;
15
	protected $mode_verbeux = false;
16
	
16
	
17
	public function executer() {
17
	public function executer() {
18
		$cmd = $this->getParametre('a');
18
		$cmd = $this->getParametre('a');
19
		$this->mode_verbeux = $this->getParametre('v');
19
		$this->mode_verbeux = $this->getParametre('v');
20
		
20
		
21
		switch($cmd) {
21
		switch($cmd) {
22
			case 'migrerFormatSmartFlore' :
22
			case 'migrerFormatSmartFlore' :
23
				$this->migrerFormatSmartFlore();
23
				$this->migrerFormatSmartFlore();
24
			break;
24
			break;
25
			
25
			
26
			case 'migrerSentiersSmartFlore' :
26
			case 'migrerSentiersSmartFlore' :
27
				$this->migrerSentiersSmartFlore();
27
				$this->migrerSentiersSmartFlore();
28
			break;
28
			break;
29
			
29
			
30
			default:
30
			default:
31
		}
31
		}
32
	}
32
	}
33
	
33
	
34
	protected function migrerSentiersSmartFlore() {
34
	protected function migrerSentiersSmartFlore() {
35
		$this->wiki = Registre::get('wikiApi');
35
		$this->wiki = Registre::get('wikiApi');
36
		$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
36
		$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
37
				'AND tag = "AccesProjet" ';
37
				'AND tag = "AccesProjet" ';
38
				
38
				
39
		$page_sentiers = $this->wiki->LoadSingle($requete);
39
		$page_sentiers = $this->wiki->LoadSingle($requete);
40
		// Attention les wiki sont en iso Argh%#[{!?
40
		// Attention les wiki sont en iso Argh%#[{!?
41
		// Il faut convertir car sinon certains sentiers ne matcheront pas à leur propriétaire
41
		// Il faut convertir car sinon certains sentiers ne matcheront pas à leur propriétaire
42
		$page_sentiers['body'] = mb_convert_encoding($page_sentiers['body'], Config::get('encodage_appli'), Config::get('encodage_wiki'));
42
		$page_sentiers['body'] = mb_convert_encoding($page_sentiers['body'], Config::get('encodage_appli'), Config::get('encodage_wiki'));
43
		preg_match_all("|\[\[([^\]\]]*)\]\]|", $page_sentiers['body'], $sentiers, PREG_PATTERN_ORDER);
43
		preg_match_all("|\[\[([^\]\]]*)\]\]|", $page_sentiers['body'], $sentiers, PREG_PATTERN_ORDER);
44
		
44
		
45
		// Seule une partie du tableau contenant les noms des sentiers nous interesse
45
		// Seule une partie du tableau contenant les noms des sentiers nous interesse
46
		$sentiers = $sentiers[1];
46
		$sentiers = $sentiers[1];
47
		
47
		
48
		echo "Nombre de sentiers à migrer : ".count($sentiers)."\n";
48
		echo "Nombre de sentiers à migrer : ".count($sentiers)."\n";
49
		
49
		
50
		$valeurs_sentiers_a_inserer = array();
50
		$valeurs_sentiers_a_inserer = array();
51
		
51
		
52
		$proprietaires_sentiers = array();
52
		$proprietaires_sentiers = array();
53
		// Chargement du fichier contenant les propriétaires à associer aux sentiers
53
		// Chargement du fichier contenant les propriétaires à associer aux sentiers
54
		$fichier = file(realpath(dirname(__FILE__)).'/proprietaires_sentiers.csv');
54
		$fichier = file(realpath(dirname(__FILE__)).'/proprietaires_sentiers.csv');
55
		
55
		
56
		foreach ($fichier as $ligne) {
56
		foreach ($fichier as $ligne) {
57
			$data = str_getcsv($ligne);
57
			$data = str_getcsv($ligne);
58
			if($data[2] != "") {
58
			if($data[2] != "") {
59
				// on associe un titre de sentier à un email (la clé est le titre de sentier)
59
				// on associe un titre de sentier à un email (la clé est le titre de sentier)
60
				$proprietaires_sentiers[trim($data[0])] = trim($data[2]);
60
				$proprietaires_sentiers[trim($data[0])] = trim($data[2]);
61
			}		
61
			}		
62
		}
62
		}
63
		
63
		
64
		$courriel_proprietaires = array_values(array_unique($proprietaires_sentiers));	
64
		$courriel_proprietaires = array_values(array_unique($proprietaires_sentiers));	
65
		// Chargement des infos des utilisateurs pour obtenirs leurs nomWikis associés
65
		// Chargement des infos des utilisateurs pour obtenirs leurs nomWikis associés
66
		$url_infos_courriels = 	Config::get('annuaire_infos_courriels_url').implode(',', $courriel_proprietaires);
66
		$url_infos_courriels = 	Config::get('annuaire_infos_courriels_url').implode(',', $courriel_proprietaires);
67
		$infos_proprietaires = json_decode(file_get_contents($url_infos_courriels), true);
67
		$infos_proprietaires = json_decode(file_get_contents($url_infos_courriels), true);
68
		
68
		
69
		$infos_proprietaires_a_sentier = array();
69
		$infos_proprietaires_a_sentier = array();
70
		
70
		
71
		foreach($proprietaires_sentiers as $nom_sentier => $proprietaire_sentier) {
71
		foreach($proprietaires_sentiers as $nom_sentier => $proprietaire_sentier) {
72
			if(isset($infos_proprietaires[$proprietaire_sentier])) {
72
			if(isset($infos_proprietaires[$proprietaire_sentier])) {
73
				$infos_proprietaires_a_sentier[$nom_sentier] = $infos_proprietaires[$proprietaire_sentier]['nomWiki'];
73
				$infos_proprietaires_a_sentier[$nom_sentier] = $infos_proprietaires[$proprietaire_sentier]['nomWiki'];
74
			} else {
74
			} else {
75
				// les sentiers sans propriétaires sont affectés au compte accueil
75
				// les sentiers sans propriétaires sont affectés au compte accueil
76
				$infos_proprietaires_a_sentier[$nom_sentier] = "AssociationTelaBotanica";
76
				$infos_proprietaires_a_sentier[$nom_sentier] = "AssociationTelaBotanica";
77
			}
77
			}
78
		}
78
		}
79
		
79
		
80
		$requete_insertion = 'INSERT INTO '.$this->wiki->GetConfigValue('table_prefix').'triples '.
80
		$requete_insertion = 'INSERT INTO '.$this->wiki->GetConfigValue('table_prefix').'triples '.
81
					'(resource, property, value) VALUES ';
81
					'(resource, property, value) VALUES ';
82
		
82
		
83
		foreach($sentiers as $sentier) {
83
		foreach($sentiers as $sentier) {
84
			
84
 
85
			list($tag, $titre) = explode(' ', $sentier, 2);
85
			list($tag, $titre) = explode(' ', $sentier, 2);
-
 
86
			$titre = trim($titre);
86
			// Reconversion dans l'encodage du wiki pour l'insertion
87
			// Reconversion dans l'encodage du wiki pour l'insertion
87
			$titre_encode_wiki = mb_convert_encoding($titre, Config::get('encodage_wiki'), Config::get('encodage_appli'));
88
			$titre_encode_wiki = mb_convert_encoding($titre, Config::get('encodage_wiki'), Config::get('encodage_appli'));
88
			
89
			
89
			$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
90
			$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
90
					'AND tag = "'.$tag.'" ';
91
					'AND tag = "'.$tag.'" ';
91
			
92
			
92
			$infos_sentier = $this->wiki->LoadSingle($requete);
93
			$infos_sentier = $this->wiki->LoadSingle($requete);
93
		
94
		
94
			$proprietaire = !empty($infos_proprietaires_a_sentier[$titre]) ? $infos_proprietaires_a_sentier[$titre] : "AssociationTelaBotanica";
95
			$proprietaire = !empty($infos_proprietaires_a_sentier[$titre]) ? $infos_proprietaires_a_sentier[$titre] : "AssociationTelaBotanica";
95
			$valeurs_sentiers_a_inserer[] = "('".addslashes(trim($titre_encode_wiki))."', 'smartFlore.sentiers', '".$proprietaire."')";
96
			$valeurs_sentiers_a_inserer[] = "('".addslashes(trim($titre_encode_wiki))."', 'smartFlore.sentiers', '".$proprietaire."')";
96
			
97
			
97
			// Recherche de toutes les fiches contenues dans le sentier (normalement sous forme de liens vers des fiches de type 
98
			// Recherche de toutes les fiches contenues dans le sentier (normalement sous forme de liens vers des fiches de type 
98
			// SmartFloreYYYntZZZ où YYY est un code de référentiel et ZZZ un numéro taxonomique)
99
			// SmartFloreYYYntZZZ où YYY est un code de référentiel et ZZZ un numéro taxonomique)
99
			preg_match_all("|\[\[(SmartFlore[^(?:nt)]*nt[0-9]*)|", $infos_sentier['body'], $fiches_du_sentier, PREG_PATTERN_ORDER);
100
			preg_match_all("|\[\[(SmartFlore[^(?:nt)]*nt[0-9]*)|", $infos_sentier['body'], $fiches_du_sentier, PREG_PATTERN_ORDER);
100
			
101
			
101
			if(!empty($fiches_du_sentier[0])) {
102
			if(!empty($fiches_du_sentier[0])) {
102
				foreach($fiches_du_sentier[1] as $fiche_du_sentier) {					
103
				foreach($fiches_du_sentier[1] as $fiche_du_sentier) {					
103
					$valeurs_fiches_a_associer[] = "('".$fiche_du_sentier."', 'smartFlore.sentiers.fiche', '".addslashes(trim($titre_encode_wiki))."')";
104
					$valeurs_fiches_a_associer[] = "('".$fiche_du_sentier."', 'smartFlore.sentiers.fiche', '".addslashes(trim($titre_encode_wiki))."')";
104
				}
105
				}
105
			}
106
			}
106
		}
107
		}
107
		
108
		
108
		$valeurs_a_inserer = $valeurs_sentiers_a_inserer + $valeurs_fiches_a_associer;
109
		$valeurs_a_inserer = array_merge($valeurs_sentiers_a_inserer, $valeurs_fiches_a_associer);
109
		$requete_insertion .= implode(', '."\n", $valeurs_a_inserer);
110
		$requete_insertion .= implode(', '."\n", $valeurs_a_inserer);
110
		// Tout est contenu dans la table triple du wiki, donc une seule requête suffit pour tout insérer
111
		// Tout est contenu dans la table triple du wiki, donc une seule requête suffit pour tout insérer
111
		$this->wiki->Query($requete_insertion);
112
		$this->wiki->Query($requete_insertion);
112
		
113
		
113
		echo 'Migration des sentiers effectuée'."\n";
114
		echo 'Migration des sentiers effectuée'."\n";
114
		exit;
115
		exit;
115
	}
116
	}
116
	
117
	
117
	protected function migrerFormatSmartFlore() {	
118
	protected function migrerFormatSmartFlore() {	
118
 
119
 
119
		// sections "souples" - attention, ne seront pas "quotées" mais interprétées comme morceaux de regexp directement !
120
		// sections "souples" - attention, ne seront pas "quotées" mais interprétées comme morceaux de regexp directement !
120
		$sections = array("Fiche simplifi.+e Smart.+flore", "Introduction","Comment la reconna.+tre.+","Son histoire","Ses usages",".+(?:cologie|habitat).+","Ce qu.+il faut savoir.+","Sources");
121
		$sections = array("Fiche simplifi.+e Smart.+flore", "Introduction","Comment la reconna.+tre.+","Son histoire","Ses usages",".+(?:cologie|habitat).+","Ce qu.+il faut savoir.+","Sources");
121
		$nouvelles_sections = array(
122
		$nouvelles_sections = array(
122
			"Description" => array("Introduction","Comment la reconna.+tre.+","Son histoire"),
123
			"Description" => array("Introduction","Comment la reconna.+tre.+","Son histoire"),
123
			"Usages" => array("Ses usages", "Ce qu.+il faut savoir.+"),
124
			"Usages" => array("Ses usages", "Ce qu.+il faut savoir.+"),
124
			"Écologie & habitat" => array(".+(?:cologie|habitat).+"), // groupe non-capturant avec (?:a|b)
125
			"Écologie & habitat" => array(".+(?:cologie|habitat).+"), // groupe non-capturant avec (?:a|b)
125
			"Sources" => array("Sources")
126
			"Sources" => array("Sources")
126
		);
127
		);
127
		
128
		
128
		$where_section = 'body NOT LIKE "';
129
		$where_section = 'body NOT LIKE "';
129
		$nouvelles_sections_k = array_keys($nouvelles_sections);
130
		$nouvelles_sections_k = array_keys($nouvelles_sections);
130
		foreach($nouvelles_sections_k as $nouvelle_section_k) {
131
		foreach($nouvelles_sections_k as $nouvelle_section_k) {
131
			// Encore et toujours de l'iso (d'ailleurs si on ne fait pas de conversion la requete se comporte
132
			// Encore et toujours de l'iso (d'ailleurs si on ne fait pas de conversion la requete se comporte
132
			// très bizarrement et renvoie des résultats en trop une fois le script déjà exécuté)
133
			// très bizarrement et renvoie des résultats en trop une fois le script déjà exécuté)
133
			$where_section .= '%'.addslashes(ManipulationPage::convertirTexteAppliVersEncodageWiki($nouvelle_section_k)).'%';
134
			$where_section .= '%'.addslashes(ManipulationPage::convertirTexteAppliVersEncodageWiki($nouvelle_section_k)).'%';
134
		}
135
		}
135
		$where_section = $where_section.'"';
136
		$where_section = $where_section.'"';
136
			
137
			
137
		$this->wiki = Registre::get('wikiApi');
138
		$this->wiki = Registre::get('wikiApi');
138
		$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
139
		$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
139
						'AND tag LIKE "SmartFlore%nt%" '.
140
						'AND tag LIKE "SmartFlore%nt%" '.
140
						'AND '.$where_section;
141
						'AND '.$where_section;
141
 
142
 
142
		$pages = $this->wiki->LoadAll($requete);
143
		$pages = $this->wiki->LoadAll($requete);
143
		$pages_fmt = array();
144
		$pages_fmt = array();
144
		echo "Nombre de pages à migrer : ".count($pages)."\n";
145
		echo "Nombre de pages à migrer : ".count($pages)."\n";
145
 
146
 
146
		if(!empty($pages)) {
147
		if(!empty($pages)) {
147
			$manipulation = new ManipulationPage($this->wiki, $pages[0]);
148
			$manipulation = new ManipulationPage($this->wiki, $pages[0]);
148
			echo "Migration en cours... \n";
149
			echo "Migration en cours... \n";
149
			
150
			
150
			foreach($pages as &$page) {
151
			foreach($pages as &$page) {
151
				
152
				
152
				$page_fmt = array();
153
				$page_fmt = array();
153
				
154
				
154
				// On capte l'entête de la page situé avant la première section pour le recopier
155
				// On capte l'entête de la page situé avant la première section pour le recopier
155
				// dans les nouvelles pages (il contient les backlinks et les noms)
156
				// dans les nouvelles pages (il contient les backlinks et les noms)
156
				$delim_entete = strpos($page["body"], "==== Introduction ====");
157
				$delim_entete = strpos($page["body"], "==== Introduction ====");
157
				if($delim_entete === false) {
158
				if($delim_entete === false) {
158
					$delim_entete = strpos($page["body"], "====Introduction====");
159
					$delim_entete = strpos($page["body"], "====Introduction====");
159
				}
160
				}
160
				// Attention l'entete est en iso, il faut le convertir manuellement
161
				// Attention l'entete est en iso, il faut le convertir manuellement
161
				$entete = $manipulation->convertirTexteWikiVersEncodageAppli(substr($page["body"], 0, $delim_entete));
162
				$entete = $manipulation->convertirTexteWikiVersEncodageAppli(substr($page["body"], 0, $delim_entete));
162
				
163
				
163
				// Par contre ici consulterPageSectionsFormatees est gentil et fait la conversion vers l'encodage de l'appli pour nous
164
				// Par contre ici consulterPageSectionsFormatees est gentil et fait la conversion vers l'encodage de l'appli pour nous
164
				$manipulation->consulterPageSectionsFormatees($page, implode(',', $sections));
165
				$manipulation->consulterPageSectionsFormatees($page, implode(',', $sections));
165
				
166
				
166
				// Fusion des anciennes sections dans les nouvelles
167
				// Fusion des anciennes sections dans les nouvelles
167
				foreach($nouvelles_sections as $nom_nouvelle_section => $sections_a_fusionner) {
168
				foreach($nouvelles_sections as $nom_nouvelle_section => $sections_a_fusionner) {
168
					$page_fmt[$nom_nouvelle_section] = '===='.$nom_nouvelle_section.'====';
169
					$page_fmt[$nom_nouvelle_section] = '===='.$nom_nouvelle_section.'====';
169
					foreach($sections_a_fusionner as $section_a_fusionner) {
170
					foreach($sections_a_fusionner as $section_a_fusionner) {
170
						if(isset($page['sections'][$section_a_fusionner])) {
171
						if(isset($page['sections'][$section_a_fusionner])) {
171
							$page_fmt[$nom_nouvelle_section] .= $page['sections'][$section_a_fusionner];
172
							$page_fmt[$nom_nouvelle_section] .= $page['sections'][$section_a_fusionner];
172
						}
173
						}
173
					}
174
					}
174
				}
175
				}
175
				
176
				
176
				$corps = $entete."\n".implode("\n", $page_fmt);
177
				$corps = $entete."\n".implode("\n", $page_fmt);
177
				$manipulation->ecrirePage($page["tag"], $corps);
178
				$manipulation->ecrirePage($page["tag"], $corps);
178
			}
179
			}
179
		}
180
		}
180
		echo "Migration effectuée \n";
181
		echo "Migration effectuée \n";
181
		// Le exit est là pour empecher l'affichage d'être pollué par les erreurs 
182
		// Le exit est là pour empecher l'affichage d'être pollué par les erreurs 
182
		// dûes à certaines antédiluviennités de wikini
183
		// dûes à certaines antédiluviennités de wikini
183
		exit;
184
		exit;
184
	}
185
	}
185
	
186
	
186
	// http://stackoverflow.com/questions/834303/startswith-and-endswith-functions-in-php
187
	// http://stackoverflow.com/questions/834303/startswith-and-endswith-functions-in-php
187
	protected function endsWith($haystack, $needle) {
188
	protected function endsWith($haystack, $needle) {
188
		// search forward starting from end minus needle length characters
189
		// search forward starting from end minus needle length characters
189
		return $needle === "" || (($temp = strlen($haystack) - strlen($needle)) >= 0 && strpos($haystack, $needle, $temp) !== FALSE);
190
		return $needle === "" || (($temp = strlen($haystack) - strlen($needle)) >= 0 && strpos($haystack, $needle, $temp) !== FALSE);
190
	}
191
	}
191
}
192
}