50 |
aurelien |
1 |
<?php
|
|
|
2 |
// declare(encoding='UTF-8');
|
|
|
3 |
/**
|
|
|
4 |
*
|
|
|
5 |
* @category wiki/smart'Flore
|
|
|
6 |
* @package Scripts
|
|
|
7 |
* @author Aurelien PERONNET <aurelien@tela-botanica.org>
|
|
|
8 |
* @license GPL v3 <http://www.gnu.org/licenses/gpl.txt>
|
|
|
9 |
* @license CECILL v2 <http://www.cecill.info/licences/Licence_CeCILL_V2-en.txt>
|
|
|
10 |
* @copyright 1999-2015 Tela Botanica <accueil@tela-botanica.org>
|
|
|
11 |
*/
|
|
|
12 |
|
|
|
13 |
class MigrationSmartFlore extends Script {
|
|
|
14 |
|
|
|
15 |
protected $mode_verbeux = false;
|
|
|
16 |
|
|
|
17 |
public function executer() {
|
|
|
18 |
$cmd = $this->getParametre('a');
|
|
|
19 |
$this->mode_verbeux = $this->getParametre('v');
|
|
|
20 |
|
|
|
21 |
switch($cmd) {
|
64 |
aurelien |
22 |
case 'migrerFormatSmartFlore' :
|
50 |
aurelien |
23 |
$this->migrerFormatSmartFlore();
|
|
|
24 |
break;
|
|
|
25 |
|
64 |
aurelien |
26 |
case 'migrerSentiersSmartFlore' :
|
|
|
27 |
$this->migrerSentiersSmartFlore();
|
|
|
28 |
break;
|
|
|
29 |
|
50 |
aurelien |
30 |
default:
|
|
|
31 |
}
|
|
|
32 |
}
|
|
|
33 |
|
64 |
aurelien |
34 |
protected function migrerSentiersSmartFlore() {
|
|
|
35 |
$this->wiki = Registre::get('wikiApi');
|
|
|
36 |
$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
|
|
|
37 |
'AND tag = "AccesProjet" ';
|
|
|
38 |
|
|
|
39 |
$page_sentiers = $this->wiki->LoadSingle($requete);
|
67 |
aurelien |
40 |
// Attention les wiki sont en iso Argh%#[{!?
|
|
|
41 |
// Il faut convertir car sinon certains sentiers ne matcheront pas à leur propriétaire
|
|
|
42 |
$page_sentiers['body'] = mb_convert_encoding($page_sentiers['body'], Config::get('encodage_appli'), Config::get('encodage_wiki'));
|
|
|
43 |
preg_match_all("|\[\[([^\]\]]*)\]\]|", $page_sentiers['body'], $sentiers, PREG_PATTERN_ORDER);
|
64 |
aurelien |
44 |
|
67 |
aurelien |
45 |
// Seule une partie du tableau contenant les noms des sentiers nous interesse
|
64 |
aurelien |
46 |
$sentiers = $sentiers[1];
|
|
|
47 |
|
|
|
48 |
echo "Nombre de sentiers à migrer : ".count($sentiers)."\n";
|
|
|
49 |
|
|
|
50 |
$valeurs_sentiers_a_inserer = array();
|
|
|
51 |
|
|
|
52 |
$proprietaires_sentiers = array();
|
|
|
53 |
// Chargement du fichier contenant les propriétaires à associer aux sentiers
|
67 |
aurelien |
54 |
$fichier = file(realpath(dirname(__FILE__)).'/proprietaires_sentiers.csv');
|
64 |
aurelien |
55 |
|
|
|
56 |
foreach ($fichier as $ligne) {
|
|
|
57 |
$data = str_getcsv($ligne);
|
67 |
aurelien |
58 |
if($data[2] != "") {
|
|
|
59 |
// on associe un titre de sentier à un email (la clé est le titre de sentier)
|
64 |
aurelien |
60 |
$proprietaires_sentiers[trim($data[0])] = trim($data[2]);
|
|
|
61 |
}
|
|
|
62 |
}
|
|
|
63 |
|
|
|
64 |
$courriel_proprietaires = array_values(array_unique($proprietaires_sentiers));
|
67 |
aurelien |
65 |
// Chargement des infos des utilisateurs pour obtenirs leurs nomWikis associés
|
64 |
aurelien |
66 |
$url_infos_courriels = Config::get('annuaire_infos_courriels_url').implode(',', $courriel_proprietaires);
|
|
|
67 |
$infos_proprietaires = json_decode(file_get_contents($url_infos_courriels), true);
|
|
|
68 |
|
|
|
69 |
$infos_proprietaires_a_sentier = array();
|
|
|
70 |
|
|
|
71 |
foreach($proprietaires_sentiers as $nom_sentier => $proprietaire_sentier) {
|
|
|
72 |
if(isset($infos_proprietaires[$proprietaire_sentier])) {
|
|
|
73 |
$infos_proprietaires_a_sentier[$nom_sentier] = $infos_proprietaires[$proprietaire_sentier]['nomWiki'];
|
|
|
74 |
} else {
|
|
|
75 |
// les sentiers sans propriétaires sont affectés au compte accueil
|
|
|
76 |
$infos_proprietaires_a_sentier[$nom_sentier] = "AssociationTelaBotanica";
|
|
|
77 |
}
|
|
|
78 |
}
|
|
|
79 |
|
|
|
80 |
$requete_insertion = 'INSERT INTO '.$this->wiki->GetConfigValue('table_prefix').'triples '.
|
|
|
81 |
'(resource, property, value) VALUES ';
|
|
|
82 |
|
|
|
83 |
foreach($sentiers as $sentier) {
|
|
|
84 |
|
67 |
aurelien |
85 |
list($tag, $titre) = explode(' ', $sentier, 2);
|
|
|
86 |
// Reconversion dans l'encodage du wiki pour l'insertion
|
|
|
87 |
$titre_encode_wiki = mb_convert_encoding($titre, Config::get('encodage_wiki'), Config::get('encodage_appli'));
|
64 |
aurelien |
88 |
|
|
|
89 |
$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
|
|
|
90 |
'AND tag = "'.$tag.'" ';
|
|
|
91 |
|
|
|
92 |
$infos_sentier = $this->wiki->LoadSingle($requete);
|
67 |
aurelien |
93 |
|
64 |
aurelien |
94 |
$proprietaire = !empty($infos_proprietaires_a_sentier[$titre]) ? $infos_proprietaires_a_sentier[$titre] : "AssociationTelaBotanica";
|
67 |
aurelien |
95 |
$valeurs_sentiers_a_inserer[] = "('".addslashes(trim($titre_encode_wiki))."', 'smartFlore.sentiers', '".$proprietaire."')";
|
64 |
aurelien |
96 |
|
67 |
aurelien |
97 |
// Recherche de toutes les fiches contenues dans le sentier (normalement sous forme de liens vers des fiches de type
|
|
|
98 |
// SmartFloreYYYntZZZ où YYY est un code de référentiel et ZZZ un numéro taxonomique)
|
64 |
aurelien |
99 |
preg_match_all("|\[\[(SmartFlore[^(?:nt)]*nt[0-9]*)|", $infos_sentier['body'], $fiches_du_sentier, PREG_PATTERN_ORDER);
|
|
|
100 |
|
|
|
101 |
if(!empty($fiches_du_sentier[0])) {
|
67 |
aurelien |
102 |
foreach($fiches_du_sentier[1] as $fiche_du_sentier) {
|
|
|
103 |
$valeurs_fiches_a_associer[] = "('".$fiche_du_sentier."', 'smartFlore.sentiers.fiche', '".addslashes(trim($titre_encode_wiki))."')";
|
64 |
aurelien |
104 |
}
|
|
|
105 |
}
|
|
|
106 |
}
|
|
|
107 |
|
|
|
108 |
$valeurs_a_inserer = $valeurs_sentiers_a_inserer + $valeurs_fiches_a_associer;
|
|
|
109 |
$requete_insertion .= implode(', '."\n", $valeurs_a_inserer);
|
|
|
110 |
// Tout est contenu dans la table triple du wiki, donc une seule requête suffit pour tout insérer
|
|
|
111 |
$this->wiki->Query($requete_insertion);
|
|
|
112 |
|
|
|
113 |
echo 'Migration des sentiers effectuée'."\n";
|
|
|
114 |
exit;
|
|
|
115 |
}
|
|
|
116 |
|
50 |
aurelien |
117 |
protected function migrerFormatSmartFlore() {
|
|
|
118 |
|
62 |
mathias |
119 |
// sections "souples" - attention, ne seront pas "quotées" mais interprétées comme morceaux de regexp directement !
|
|
|
120 |
$sections = array("Fiche simplifi.+e Smart.+flore", "Introduction","Comment la reconna.+tre.+","Son histoire","Ses usages",".+(?:cologie|habitat).+","Ce qu.+il faut savoir.+","Sources");
|
50 |
aurelien |
121 |
$nouvelles_sections = array(
|
64 |
aurelien |
122 |
"Description" => array("Introduction","Comment la reconna.+tre.+","Son histoire"),
|
|
|
123 |
"Usages" => array("Ses usages", "Ce qu.+il faut savoir.+"),
|
62 |
mathias |
124 |
"Écologie & habitat" => array(".+(?:cologie|habitat).+"), // groupe non-capturant avec (?:a|b)
|
64 |
aurelien |
125 |
"Sources" => array("Sources")
|
50 |
aurelien |
126 |
);
|
|
|
127 |
|
|
|
128 |
$where_section = 'body NOT LIKE "';
|
|
|
129 |
$nouvelles_sections_k = array_keys($nouvelles_sections);
|
|
|
130 |
foreach($nouvelles_sections_k as $nouvelle_section_k) {
|
|
|
131 |
// Encore et toujours de l'iso (d'ailleurs si on ne fait pas de conversion la requete se comporte
|
|
|
132 |
// très bizarrement et renvoie des résultats en trop une fois le script déjà exécuté)
|
|
|
133 |
$where_section .= '%'.addslashes(ManipulationPage::convertirTexteAppliVersEncodageWiki($nouvelle_section_k)).'%';
|
|
|
134 |
}
|
|
|
135 |
$where_section = $where_section.'"';
|
|
|
136 |
|
|
|
137 |
$this->wiki = Registre::get('wikiApi');
|
|
|
138 |
$requete = 'SELECT * FROM '.$this->wiki->GetConfigValue('table_prefix').'pages WHERE latest = "Y" '.
|
|
|
139 |
'AND tag LIKE "SmartFlore%nt%" '.
|
|
|
140 |
'AND '.$where_section;
|
|
|
141 |
|
|
|
142 |
$pages = $this->wiki->LoadAll($requete);
|
|
|
143 |
$pages_fmt = array();
|
|
|
144 |
echo "Nombre de pages à migrer : ".count($pages)."\n";
|
|
|
145 |
|
|
|
146 |
if(!empty($pages)) {
|
|
|
147 |
$manipulation = new ManipulationPage($this->wiki, $pages[0]);
|
|
|
148 |
echo "Migration en cours... \n";
|
|
|
149 |
|
|
|
150 |
foreach($pages as &$page) {
|
|
|
151 |
|
|
|
152 |
$page_fmt = array();
|
|
|
153 |
|
|
|
154 |
// On capte l'entête de la page situé avant la première section pour le recopier
|
|
|
155 |
// dans les nouvelles pages (il contient les backlinks et les noms)
|
|
|
156 |
$delim_entete = strpos($page["body"], "==== Introduction ====");
|
|
|
157 |
if($delim_entete === false) {
|
|
|
158 |
$delim_entete = strpos($page["body"], "====Introduction====");
|
|
|
159 |
}
|
|
|
160 |
// Attention l'entete est en iso, il faut le convertir manuellement
|
|
|
161 |
$entete = $manipulation->convertirTexteWikiVersEncodageAppli(substr($page["body"], 0, $delim_entete));
|
|
|
162 |
|
|
|
163 |
// Par contre ici consulterPageSectionsFormatees est gentil et fait la conversion vers l'encodage de l'appli pour nous
|
|
|
164 |
$manipulation->consulterPageSectionsFormatees($page, implode(',', $sections));
|
|
|
165 |
|
|
|
166 |
// Fusion des anciennes sections dans les nouvelles
|
|
|
167 |
foreach($nouvelles_sections as $nom_nouvelle_section => $sections_a_fusionner) {
|
|
|
168 |
$page_fmt[$nom_nouvelle_section] = '===='.$nom_nouvelle_section.'====';
|
|
|
169 |
foreach($sections_a_fusionner as $section_a_fusionner) {
|
|
|
170 |
if(isset($page['sections'][$section_a_fusionner])) {
|
|
|
171 |
$page_fmt[$nom_nouvelle_section] .= $page['sections'][$section_a_fusionner];
|
|
|
172 |
}
|
|
|
173 |
}
|
|
|
174 |
}
|
|
|
175 |
|
|
|
176 |
$corps = $entete."\n".implode("\n", $page_fmt);
|
|
|
177 |
$manipulation->ecrirePage($page["tag"], $corps);
|
|
|
178 |
}
|
|
|
179 |
}
|
|
|
180 |
echo "Migration effectuée \n";
|
|
|
181 |
// Le exit est là pour empecher l'affichage d'être pollué par les erreurs
|
|
|
182 |
// dûes à certaines antédiluviennités de wikini
|
|
|
183 |
exit;
|
|
|
184 |
}
|
|
|
185 |
|
|
|
186 |
// http://stackoverflow.com/questions/834303/startswith-and-endswith-functions-in-php
|
|
|
187 |
protected function endsWith($haystack, $needle) {
|
|
|
188 |
// search forward starting from end minus needle length characters
|
|
|
189 |
return $needle === "" || (($temp = strlen($haystack) - strlen($needle)) >= 0 && strpos($haystack, $needle, $temp) !== FALSE);
|
|
|
190 |
}
|
|
|
191 |
}
|