Hogy az adatokból üzlet szülessen

Az időjárás adatok értéke

2016. szeptember 13. 11:04 - Dr. Pach Ferenc Péter

Miért költött el az egyik legnagyobb IT vállalat több, mint 2 milliárd dollárt egy időjárással foglalkozó cég felvásárlására?

 

Azért mert az időjárás adatok bizony hatalmas adatvagyonnak számítanak, no de miért is és kinek a számára?

 

Az utóbbi hetekben a közösségi médiában egyre több bejegyzést is olvashattam arról, hogy egy magyarországi népszerű üdülőkörzet térségében nagyon gyakran terjeng valamilyen furcsa szag, bűz. Mondanom sem kell, hogy ez jelentős mértékben megkeseríti az ott élők életét (főként a nyári időszakban, ahol még nyaralók ezrei is érkeznek oda pihenni, kikapcsolódni, akár mint fizetős szállóvendégek).

 

A szagkibocsátás a lakosság által feltételezhető forrása egy a közelben lévő hulladéklerakó telep nem előírás-szerű működése, azonban erre kevés a konkrét tárgyi (adatokkal kellőképpen alátámasztott) bizonyíték a kezükben. A hatóság által készített vagy elvárt mérések és abból az elemzések a területen uralkodó szélirány és szélsebesség adatok alapján a lerakó szaghatását a környező lakóterületekre nem igazolták. Viszont ezzel szemben a lakosság számos esetben érzékelte a szaghatást, akár több kilométerre is a feltételezett szagforrástól. Miért van ez a látszólagos ellentmondás?

 

Utánajárva kicsit az ilyen környezeti hatástanulmányoknak (általánosan és a konkrét ügyben is megismerve a kalkulációkat, s az elvégzett modellezéseket) gyorsan megállapítható, hogy mivel hazánkban jelenleg nincsen szabályozva és ezáltal előírva egy ilyen elemzés és modellezés elvárt tartalma, így annak módját és mélységét az elemzést és modellezést végzők határozzák meg (jobb esetben nem ad hoc kitalált módon, hanem valamilyen szakirodalmi forrás alapján).

 

Ez a helyzet kicsit olyan, mintha mondjuk egy gyógyszerfejlesztési projektben a klinikai vizsgálatok adatainak a kiértékeléséhez nem szabályoznák le előre azt (illetve ún. guideline-okat sem adnának a hatóságok), hogy milyen típusú vizsgálatnál milyen statisztikai módszert kellene alkalmazni (mindenki azt használná amit szokott, amit ismer, vagy éppen aznap szeretne használni, s persze így nagyon könnyen jöhetnek ki inkonzisztens eredmények akár egy megismételt elemzés során is...).

 

De akkor mit tehet ilyen esetben a lakosság, hogy a probléma lehetőleg mielőbb megoldódjon?

 

Egyrészt például szakmailag helyes kérdéseket fogalmazhat meg, elsősorban a hatóság felé, az eddig elvégzett, vagy elvégeztetett elemzésekkel és modellezésekkel kapcsolatosan (igénybe véve egy tapasztalt adatelemző segítségét). Konkrétan: 1. Milyen időjárás forrásadatokból és miért éppen azokból készítették az elemzéseket?, 2. Miért az átlagos (éves eredő) szélirányt és szélsebességet vették csak figyelembe, s miért nem alkalmaztak pl. heti/havi/negyedéves bontásokat, vagyis miért csak egy db éves szélrózsát készítettek el azt is csak egy db paraméter kombinációval (mintha csak egy statikus rendszert vizsgálnának...mintha sosem változna pl. a szagkibocsátás intenzitása, a hulladék mennyisége, stb.)? 3. Végeztek-e vizsgálatot arra vonatkozóan, hogy pontosan milyen a mérési adatsor varianciája (mondjuk egy napon belül mennyire nagy a szélirány és szélsebesség szórása), s olyat, hogy mennyire jellemző az idősorokra a szezonalitás (nyáron a magasabb környezeti hőmérséklet hatására nem lehetséges- hogy megváltozik a térségre jellemző széljárás)? 4. Milyen egyéb időjárási tényezőket vizsgáltak meg, vagy éppen nem vizsgáltak meg (hőmérséklet, páratartalom, légköri nyomás, stb.), amelyek esetleg hatással lehetnek a szag terjedésére?

 

A kérdések megfogalmazásán (és megküldésén) felül, célszerű meglévő adatforrásokat keresni, illetve új adatforrásokat is képezni: azért, hogy a geolokációs, meteorológiai és az észlelési adatokat össze tudjuk majd kötni, hiszen az észlelések és az észlelések időpontjában aktuális időjárás viszonyok a környéken egy térképen elhelyezve egyértelműen kijelölik a szagforrás lehetséges helyét (egy pár négyzetkilométeres területre is elegendő már pontosítani azt). A releváns meteorológiai mérőállomások adatait kell elsősorban megkeresni (amely nem egyszerű, mert pl. Magyarországon csak kb. egy tucat olyan állomás van - OMSZ -, amelyek adatai elérhetőek, s ráadásul fizetős szolgáltatásként) , illetve egyéb automaták adatait is lehet keresni, viszont tanácsos inkább olyan ún. open data forrásokat használni, ahol elérhetőek hisztorikusan is az időjárás adatok a kérdéses területre (minimum a szélsebesség és a szélirány), mint pl. a Windyty portálon ahol egy remek animáción is láthatóak a jelenlegi, vagy pedig a múltbeli időjárási körülmények (a mérési adatokból szimulációval képzett értékek tetszőlege helyszínre vonatkozóan).

 

Aztán az ún. meta-információt, illetve segédleteket sem árt keresni a témához, amelyek az ún. domain tudásunk bővítésén túl hasznosak még abban is, hogy konkrét példákat találhatunk arra vonatkozóan, hogy az eddig csak szeparáltan itt-ott elhelyezett (vagy írásos formában akár nem is rögzített) szagészleléseket hogyan és miként célszerű összegyűjteni: a leghatékonyabb egy a közösségi médiában is megosztott szagészlelés napló (amelyben rögzíthető a szagészlelés helye, ideje, időtartama, intenzitása stb.).

 

A megfelelő adatforrások megtalálása és leképzése esetén a következő fázisban jöhet már a konkrét adatelemzés is (milyen összefüggést találunk az egyes észlelések ideje, elhelyezkedése, illetve az időjárási adatok között). Amely szintén nem kis munka, ha megfelelően végezzük el (adatok tisztítása, integrációja, megfelelő modellek kiválasztása és alkalmazása, az eredmények ellenőrzése majd vizualizációja és közreadása), de álljunk meg egy pillanatra...

 

... kanyarodjunk csak vissza a bejegyzésem elején feltett kérdéshez.

 

És képzeljük el azt, hogy van egy olyan applikáció, amelyet letöltve minden felhasználó/lakos megoszthatná a telefon szenzorai által mért adatokat (aktuális GPS adatok, hőmérséklet, légnyomás, stb.) plusz a saját maga által érzékelt, észlelt környezeti hatásokat (pl. a szagok jelenlétét is). Elegendő volna csak egy-két "gombnyomás" az alkalmazásban, hogy az észlelés kezdete, típusa, vége információ mind megosztásra kerüljön egy adatközpontba...utána pedig az összegyűjtött adathalmaz valós időben automatikusan feldolgozásra kerüljön, hogy az összefüggéseket valós-időben láthassuk, így ha valamilyen környezeti probléma adódik, akkor a hatóságok és hivatalok a kellően hatékony lépéseket időben megtegyék és ne hónapok, sőt évek teljenek el...igazi eredmények nélkül.

 

De szép is lenne...addig is tegyünk érte mi, s használjuk ki az open data és a közösségi média nyújtotta lehetőségeket!

 

Várom az esetleges hozzászólásokat, észrevételeket, kérdéseket!

Szólj hozzá!

A bejegyzés trackback címe:

https://tritoo.blog.hu/api/trackback/id/tr4111701717

Kommentek:

A hozzászólások a vonatkozó jogszabályok  értelmében felhasználói tartalomnak minősülnek, értük a szolgáltatás technikai  üzemeltetője semmilyen felelősséget nem vállal, azokat nem ellenőrzi. Kifogás esetén forduljon a blog szerkesztőjéhez. Részletek a  Felhasználási feltételekben és az adatvédelmi tájékoztatóban.

Nincsenek hozzászólások.
süti beállítások módosítása