Benutzer-Werkzeuge

Webseiten-Werkzeuge


howto:datenmengen

Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

Link zu dieser Vergleichsansicht

Beide Seiten der vorigen Revision Vorhergehende Überarbeitung
howto:datenmengen [2018/04/01 15:09]
jau PR 688
howto:datenmengen [2018/04/03 13:23] (aktuell)
jau PR688
Zeile 33: Zeile 33:
 === weich === === weich ===
 Bei diesem Ansatz werden auch die Daten gelöscht. Die Daten werden immer mehr ausgedünnt je weiter man in die Vergangenheit geht. So behält man z.B. alle Daten von heute, behält von den letzten 2 Wochen nur eine Messung pro Minute und von der Zeit davor nur eine pro Viertelstunde. Bei diesem Ansatz werden auch die Daten gelöscht. Die Daten werden immer mehr ausgedünnt je weiter man in die Vergangenheit geht. So behält man z.B. alle Daten von heute, behält von den letzten 2 Wochen nur eine Messung pro Minute und von der Zeit davor nur eine pro Viertelstunde.
-Dazu steht das Script [[https://​github.com/​volkszaehler/​volkszaehler.org/​blob/​master/​bin/​vzcompress2.php|vzcompress2.php]] zur Verfügung. Von Haus aus hat der lokale User vz keine Rechte zum Löschen in der Datenbank, das muss man vorher ändern:+Dazu steht das Script [[https://​github.com/​volkszaehler/​volkszaehler.org/​blob/​master/​bin/​vzcompress2|vzcompress2]] zur Verfügung. Von Haus aus hat der lokale User vz keine Rechte zum Löschen in der Datenbank, das muss man vorher ändern:
 <​code>​ <​code>​
 mysql --user=root -praspberry mysql --user=root -praspberry
Zeile 50: Zeile 50:
  
 <​code>​ <​code>​
-0 3 * * * cd /​var/​www/​volkszaehler.org/​bin ; php vzcompress2.php >> /​var/​log/​vzcompress.log+0 3 * * * cd /​var/​www/​volkszaehler.org/​bin ; php vzcompress2 >> /​var/​log/​vzcompress.log
 </​code>​ </​code>​
 Die Anzahl der Daten die gelöscht werden soll, sowie die Zeiträume sind frei konfigurierbar am Ende des Scriptes. Die Anzahl der Daten die gelöscht werden soll, sowie die Zeiträume sind frei konfigurierbar am Ende des Scriptes.
Zeile 65: Zeile 65:
 Die folgende Zeile aggregiert alle bestehenden Daten. Der Vorgang kann daher einige Stunden benötigen: Die folgende Zeile aggregiert alle bestehenden Daten. Der Vorgang kann daher einige Stunden benötigen:
 <​code>​ <​code>​
-php /​var/​www/​volkszaehler.org/​bin/​aggregate.php run -m full -l day -l hour -l minute+php /​var/​www/​volkszaehler.org/​bin/​aggregate run -m full -l day -l hour -l minute
 </​code>​ </​code>​
  
 Einschränken auf eine einzelne UUID mittels: Einschränken auf eine einzelne UUID mittels:
 <​code>​ <​code>​
-php /​var/​www/​volkszaehler.org/​bin/​aggregate.php run <​UUID>​ -m full -l day -l hour -l minute+php /​var/​www/​volkszaehler.org/​bin/​aggregate run <​UUID>​ -m full -l day -l hour -l minute
 </​code>​ </​code>​
  
Zeile 76: Zeile 76:
 Das Script legt nur an, was noch nicht angelegt wurde und läuft daher nur kurz: Das Script legt nur an, was noch nicht angelegt wurde und läuft daher nur kurz:
 <​code>​ <​code>​
-*/10 * * * *  php /​var/​www/​volkszaehler.org/​bin/​aggregate.php run -m delta -l minute >/​dev/​null +*/10 * * * *  php /​var/​www/​volkszaehler.org/​bin/​aggregate run -m delta -l minute >/​dev/​null 
-1 * * * *  php /​var/​www/​volkszaehler.org/​bin/​aggregate.php run -m delta -l hour >/​dev/​null +1 * * * *  php /​var/​www/​volkszaehler.org/​bin/​aggregate run -m delta -l hour >/​dev/​null 
-0 1 * * *  php /​var/​www/​volkszaehler.org/​bin/​aggregate.php run -m delta -l day >/​dev/​null+0 1 * * *  php /​var/​www/​volkszaehler.org/​bin/​aggregate run -m delta -l day >/​dev/​null
 </​code>​ </​code>​
  
Zeile 92: Zeile 92:
 der Eintrag für "​minute"​ sieht dann also so aus: der Eintrag für "​minute"​ sieht dann also so aus:
 <​code>​ <​code>​
-*/10 * * * *  flock -n /​tmp/​flock-vz_aggregate.lock php /​var/​www/​volkszaehler.org/​bin/​aggregate.php run -m delta -l minute >/​dev/​null+*/10 * * * *  flock -n /​tmp/​flock-vz_aggregate.lock php /​var/​www/​volkszaehler.org/​bin/​aggregate run -m delta -l minute >/​dev/​null
 </​code>​ </​code>​
 Anm.: Die Einträge für "​hour"​ und "​day"​ werden nicht mit sich selbst kollidieren (...); wenn diese also kollidieren,​ dann mit "​minute";​ so laufen also höchstens 3 Aggregate-Jobs gleichzeitig (minute, hour, day) Anm.: Die Einträge für "​hour"​ und "​day"​ werden nicht mit sich selbst kollidieren (...); wenn diese also kollidieren,​ dann mit "​minute";​ so laufen also höchstens 3 Aggregate-Jobs gleichzeitig (minute, hour, day)
howto/datenmengen.txt · Zuletzt geändert: 2018/04/03 13:23 von jau