Unterschiede

Hier werden die Unterschiede zwischen zwei Versionen angezeigt.

--- howto:datenmengen [2017/04/25 19:38] – vzlogger duplicates, agg jau
+++ howto:datenmengen [2018/11/30 09:58] – [Aggregieren mit mySQL] wf_bitplan.com
@@ Zeile 20: / Zeile 20: @@
 <note tip>Man kann die Daten auch auf [[http://demo.volkszaehler.org/]] ablegen.</note>
-===== Daten löschen ====
+===== Daten löschen =====
+Die Frage wie viel Daten man entfernen kann ist oft ein Kompromiss welche Daten man jetzt braucht und wie viel davon in der Zukunft noch von Interesse ist. Ein Ansatz die Aktualdaten zu haben ohne die Datenbank zu nutzen ist der [[software:middleware:push-server|Push-Server]].
 === hart ===
 Wen die Vergangenheit nicht interessiert, der kann die Daten dafür löschen.
@@ Zeile 31: / Zeile 33: @@
 === weich ===
 Bei diesem Ansatz werden auch die Daten gelöscht. Die Daten werden immer mehr ausgedünnt je weiter man in die Vergangenheit geht. So behält man z.B. alle Daten von heute, behält von den letzten 2 Wochen nur eine Messung pro Minute und von der Zeit davor nur eine pro Viertelstunde.
-Dazu steht das Script [[https://github.com/volkszaehler/volkszaehler.org/blob/master/misc/tools/vzcompress2.php|vzcompress2.php]] zur Verfügung. Von Haus aus hat der lokale User vz keine Rechte zum Löschen in der Datenbank, das muss man vorher ändern:
+Dazu steht das Script [[https://github.com/volkszaehler/volkszaehler.org/blob/master/bin/vzcompress2|vzcompress2]] zur Verfügung. Von Haus aus hat der lokale User vz keine Rechte zum Löschen in der Datenbank, das muss man vorher ändern:
 <code>
 mysql --user=root -praspberry
@@ Zeile 48: / Zeile 50: @@
 <code>
-3 * * * cd /var/www/volkszaehler.org/misc/tools ; php vzcompress2.php >> /var/log/vzcompress.log
+3 * * * cd /var/www/volkszaehler.org/bin ; php vzcompress2 >> /var/log/vzcompress.log
 </code>
 Die Anzahl der Daten die gelöscht werden soll, sowie die Zeiträume sind frei konfigurierbar am Ende des Scriptes.
@@ Zeile 61: / Zeile 63: @@
 <code>$config['aggregation'] = true;</code>
-Die folgende Zeilen legen die zusätzliche Tabelle an und aggregieren alle bestehenden Daten. Der Vorgang kann daher einige Stunden benötigen:
+Die folgende Zeile aggregiert alle bestehenden Daten. Der Vorgang kann daher einige Stunden benötigen:
 <code>
-php /var/www/volkszaehler.org/misc/tools/aggregate.php create
+php /var/www/volkszaehler.org/bin/aggregate run -m full -l day -l hour -l minute
-php /var/www/volkszaehler.org/misc/tools/aggregate.php run -m full -l day -l hour -l minute
+</code>
+Einschränken auf eine einzelne UUID mittels:
+<code>
+php /var/www/volkszaehler.org/bin/aggregate run <UUID> -m full -l day -l hour -l minute
 </code>
@@ Zeile 70: / Zeile 76: @@
 Das Script legt nur an, was noch nicht angelegt wurde und läuft daher nur kurz:
 <code>
-*/10 * * * *  php /var/www/volkszaehler.org/misc/tools/aggregate.php run -m delta -l minute >/dev/null
+*/10 * * * *  php /var/www/volkszaehler.org/bin/aggregate run -m delta -l minute >/dev/null
-* * * *  php /var/www/volkszaehler.org/misc/tools/aggregate.php run -m delta -l hour >/dev/null
+* * * *  php /var/www/volkszaehler.org/bin/aggregate run -m delta -l hour >/dev/null
-1 * * *  php /var/www/volkszaehler.org/misc/tools/aggregate.php run -m delta -l day >/dev/null
+1 * * *  php /var/www/volkszaehler.org/bin/aggregate run -m delta -l day >/dev/null
 </code>
@@ Zeile 86: / Zeile 92: @@
 der Eintrag für "minute" sieht dann also so aus:
 <code>
-*/10 * * * *  flock -n /tmp/flock-vz_aggregate.lock php /var/www/volkszaehler.org/misc/tools/aggregate.php run -m delta -l minute >/dev/null
+*/10 * * * *  flock -n /tmp/flock-vz_aggregate.lock php /var/www/volkszaehler.org/bin/aggregate run -m delta -l minute >/dev/null
 </code>
 Anm.: Die Einträge für "hour" und "day" werden nicht mit sich selbst kollidieren (...); wenn diese also kollidieren, dann mit "minute"; so laufen also höchstens 3 Aggregate-Jobs gleichzeitig (minute, hour, day)
+=== Aggregation prüfen ===
+Den aktuellen Zustand der Aggregation (aktiv, Anzahl der Datensätze, Ratio) kann man mit dieser Middleware-Abfrage prüfen:
+<code>http://IP-ADRESSE/middleware.php/capabilities/database.json?</code>
 ===== Geringere Auflösung durch selteneres Messen =====
@@ Zeile 124: / Zeile 134: @@
 ^ "sum" | Summe | zu verwenden bei Impulsen (S0) |
 ^ "none"| | keine Aggreagtion vornehmen, alle Daten des //channel// gehen an die Middleware |
+===== Aggregieren mit mySQL =====
+**Function channelSum**
+Die folgende mySQL Hilfsfunktion berechnet die "Summe" von Werten für ein electric Meter über einen gegebenen Zeitraum.Dazu wird
+der höchste und der niedrigste Wert gesucht. Es gilt sum=max - min für solche Zähler.
+<code>
+--
+-- Volkszähler mySQL function to sum up channel data for a given time period
+--
+-- params
+--    channel_id  int   - the id of the channel
+--    from_time   date  - the time from which to sum up
+--    to_time     date  - the time to which to sum up
+--
+CREATE FUNCTION channelSum(channel_id INT, from_time DATE, to_time DATE)
+  RETURNS DOUBLE
+  DETERMINISTIC
+BEGIN
+ DECLARE d_min double;
+ DECLARE d_max double;
+ SELECT min(d.value), max(d.value) INTO d_min,d_max
+ FROM data d
+ WHERE d.timestamp between unix_timestamp(from_time)*1000 and unix_timestamp(to_time)*1000 and d.channel_id=channel_id;
+ RETURN d_max-d_min;
+END
+</code>
+**Daily Tabelle**
+Das folgende mySQL Script erzeugt eine "daily" Tabelle mit Tagessummen für Messwerte vom Typ "electric meter".
+Im Beispiel werden die Werte für den Zeitraum 2014-01-01 bis 2018-11-30 aufsummiert. Für die Erzeugung von 7450 Einträgen hat diese Abfrage ca. 2700 Sekunden Zeit gebraucht.
+Als Basis diente eine SQL-Abfrage zur Erzeugung einer Liste von Tagen siehe: https://stackoverflow.com/a/53541150/1497139
+<code>
+create table daily as
+select
+  dates.from_date,e.id,format(channelSum(e.id,dates.from_date,dates.to_date),0) as diff,e.type, p.value
+from (
+select
+  date_add('2014-01-01',interval row day)   as from_date,
+  date_add('2014-01-01',interval row+1 day) as to_date
+from (
+    SELECT @row := @row + 1 as row FROM
+    (select 0 union all select 1 union all select 3 union all select 4 union all select 5 union all select 6 union all select 6 union all select 7 union all select 8 union all select 9) t,
+    (select 0 union all select 1 union all select 3 union all select 4 union all select 5 union all select 6 union all select 6 union all select 7 union all select 8 union all select 9) t2,
+    (select 0 union all select 1 union all select 3 union all select 4 union all select 5 union all select 6 union all select 6 union all select 7 union all select 8 union all select 9) t3,
+    (select 0 union all select 1 union all select 3 union all select 4 union all select 5 union all select 6 union all select 6 union all select 7 union all select 8 union all select 9) t4,
+    (SELECT @row:=-1) r
+) sequence
+where date_add('2014-01-01',interval row+1 day) <= '2018-01-30') dates
+join entities   e
+join properties p on e.id=p.entity_id
+join properties r on e.id=r.entity_id
+where p.pkey='title' and r.pkey='resolution'
+and e.type='electric meter';
+</code>
 ===== Aufrüstung: Hardware =====