Hogy az adatokból üzlet szülessen

Meztelen a csapat, s meztelen a király?

2017. június 13. 22:29 - Dr. Pach Ferenc Péter

387 = 387 ?

2016.06.14-én csodálatos játékkal legyőztük Ausztriát az EB csoportmeccsén.

2017.06.09-én gyalázatos játékkal kikaptunk Andorrától a VB selejtezőn.

 

 

 

A két találkozóban egy közös jellemző biztosan volt, mindkét alkalommal 387 passz kísérletünk volt (tényleg, de aki nem hiszi, nézzen utána a hivatalos UEFA-s statisztikáknak itt és itt).

 

De mennyire más volt a legutóbbi 387, mint a tavalyi 387. Pedig még a passz-pontossági mutatóban javultunk is (82% vs 88%). Mi történhetett (azon kívül, hogy most nem volt lehetőség nagyobb edzőtáborban együtt készülni a meccsre)?

 

Hetek (na jó, már hónapok) óta terveztem írni a következő blog bejegyzést, mégpedig a labdarúgó utánpótlásról, ugyanis több érdekes hír és cikk jelent meg a tavasz folyamán a hazai rendszerről.

 

Csapat összetétel, Dárdai nyilatkozat, teljesítmény kényszer az utánpótlásban, és a Főnix-es példa. Csak pár fogalom, apropó, ami mellett nem érdemes szó nélkül elmenni. Pláne, ha tényszerű adatok is rendelkezésre állnak (pl. Transfermarkt, Double Pass).

 

Nézzük tehát csak őket, szép sorban.

 

Csapat összetétel: az EB-n nagyon rutinos, tapasztalt játékosok játszottak a nemzeti csapatban, olyanok, akik nemzetközi porondon is letettek már valamit az asztalra (nézhetnénk itt az összes külföldi első osztályú meccsek számát, vagy éppen a válogatott meccsek számát, de egyszerűbb összevetni, hogy ki nem játszott most pl. a középpályán: Gera Zoltán. Nagy Ádám ugyan játszott, viszont a legutóbbi olasz bajnokin sérülésből visszatérve csak 4 percet játszott (helyesebben ennyit tartózkodott a pályán), előtte 6 hetet kihagyott, vagyis szinte 100%, hogy nem volt megfelelő formában). Stieber sajnos hamar lesérült a meccs elején (de mondjuk ő sem játszott bajnoki meccset jó pár hete), a helyére beállt Nagy Dominiknak, illetve az egész szezonban alulteljesítő (és Németországban nem helytálló, ezért hazatérő) Kleinheislernek (aki az utolsó 5 NB1-es bajnokin 2 meccsen játszott csak) kellett volna tehát együttesen Gera szervező játékát pótolni...hát ez nem sikerült, mint láttuk...a hátvédsort már elemezni sem érdemes...ja és igen, a két legjobb formában lévő, külföldi ligában játszó és bomba formában lévő csatárunkat (Nikolics, Futács) be se válogattuk a keretbe (bezzeg a portugálok: Ronaldo a bajnoki győzelem, BL címvédés után is játszott, s 2 gólt fejelt a válogatott VB selejtezőjén)!

Ezek alapján ne csodálkozzunk, hogy a csapatból Dzsudzsáknak volt csak 1-2 valódi helyzete, ráadásul a 16-oson belülről, kvázi csatárként. Akkor ki is szervezte volna folyamatosan a játékot, ha még ő se tudta??? Mentek a passzok, számosságban nem is volt vele gond, csak nem úgy és nem arra mentek, ahogyan kellett volna...nem volt kinek ugyanis indítani előre (a beívelgetéseket azért ne tekintsük már koncepciónak).

 

Mi lehet a háttérben, miért is kell a nem folyamatosan játszó, nem megfelelő fizikai (és akár mentális) állapotban lévő játékosokat behívni a keretbe, s a sérült, vagy visszavonult tapasztalt és agilis játékosok helyére pedig kis (vagy semmilyen) nemzetközi rutinnal bíró fiatalokat állítani? Előfordulhat, hogy nincs miből, kiből választani? Vagy van egyáltalán választási lehetősége a mindenkori kapitánynak?

 

Nézzük meg akkor a hátországot, mi is jellemzi igazából az utánpótlást.

 

1. Tudás, kellő gyakorlat: Mit mondott az utánpótlásról a nemzetközi szinten játékosként, s edzőként is bizonyított szakavatott, Dárdai Pál még áprilisban? "Kidobott pénz az infrastruktúrára és az utánpótlásra költeni a magyar futballban, amíg a klubokat nem kötelezik arra, hogy működjenek együtt az iskolákkal, bővebben: "Ha a gyerekek 9 és 12 éves koruk között heti háromszor fociznak a napi kettő helyett, nem lesz belőlük futballista. Hiába építenek nekik pályákat, fizetik meg a velük foglalkozó edzőt és öltöztetik őket szép szerelésbe. A szakmai alapok később is hiányozni fognak a sprintek, az első labdaérintések dinamikájában, a letámadás vagy a területvédekezés automatizmusában."

 

Adódik tehát a kérdés: hol, s hogyan mérjük, illetve fejlesztjük jelenleg a 9-12 éves korosztály teljesítményét, milyen adatbázisok állnak erről rendelkezésre?

 

2. Teljesítmény kényszer az utánpótlásban, a negatív példa: az eredmény nem minden szinten kellene, hogy elsődleges prioritás legyen, de mivel minden edző, csapat a helyezésre megy, ezért csak kevés játéklehetőséget kapnak a fiatalok, nem tudnak elegendő gyakorlatot szerezni (nem a válogatottban, a mély vízbe bedobva kellene elsőként komoly, pláne nemzetközi tapasztalatot szerezniük), a belga Double Pass 3 évvel ezelőtti felmérése kapcsán már előre jelezve volt a veszély: "A belgák megállapították, hogy az utánpótlás jelenlegi rendszere nem alkalmas az eredményes működésre. Ezzel az akadémiai képzéssel csak évekre konzerváljuk a sikertelenséget." Miért? Mert egyik fő megállapításuk: "Fel kell hívni azonban a figyelmet arra, hogy a produktivitás itt elsősorban mennyiségi mérőszám, és nem ad értékelést a képzett játékosok kvalitásáról, csupán a hazai színvonalra érvényesek a megállapítások." Tehát itthon erősek vagyunk? Vagy mégsem?

 

3. A pozitív példa: Főnix: a különutas a hazai utánpótlás rendszerben, de hogy miért? Tessék elolvasni ezt a korábbi cikket róluk, érdemes, pár gondolat belőle: " ...ha egy gyermek valamihez – mindegy, hogy mihez, legyen az a sport, művészet, vagy zene – a megfelelő alapképességekkel rendelkezik, és azzal 6 és 18 éves kora között 10 ezer órát foglalkozik, annak a mestere lesz, mire felnőttkorba ér. Valami ilyesmi a filozófiánk, amiben töretlenül hiszünk." vagy: "Nálunk minden gyakorlat labdás. A 800 labdaérintés a minimum egy edzésen, de az 1200 érintés sem ritka, sőt." vagy pedig: "Örömmel hallották, hogy Dárdai Pál is mennyire jó véleménnyel volt a futsalról, hiszen ők is ebben hisznek."

 

Mi lehetne hát tenni?

 

Nyilván Dárdai nem jön vissza (egy ideig biztosan nem), viszont az utánpótlást alapjaiban át kell szervezni, tervezés, mérés, kiértékelés, továbbfejlesztés, megnézni mi működik (pozitív hazai és nemzetközi példák, best practise-ok, stratégia, adatgyűjtés, stb.), s azt is, hogy mi nem (akadémiák?), s újratervezés, minél előbb...mert nincs kiből minőségileg válogatni...így nem is lehet minőségi a válogatottunk...mert: "Nem tehetsz be egyszerre nyolc húszévest, hogy kapjanak ajándékba harminc válogatottságot. Mindig a legjobb csapatnak kell játszania." (Dárdai Pál)

 

Most a legjobb összeállításban léptünk pályára? Kétlem, a számok (és nem a passzok száma, hanem az aktuális meccsszámok, fizikai és mentális állapot, rutin, stb.) nem ezt mutatják...

 

Tehát számoljunk és kezdjük el végre jól használni a számokat, adatokat, a fociban is. Hogy az adatokból üzlet szülessen, s ne csak egyeseknek, hanem a nemzeti futballunknak, az egész nemzetnek is. Hajrá!

Szólj hozzá!

Mit kíván a magyar nemzet: adatvezérelt futballt!

2017. március 30. 18:39 - Dr. Pach Ferenc Péter

Többet ésszel, mint erővel?

A legutóbbi válogatott meccs előtt sok-sok futball rajongó ismerősömmel nagy várakozással tekintettünk a meccs elé, felelevenítve a tavalyi EB talán egyik legizgalmasabb, s legpörgősebb összecsapását.

 

Aztán, ahogy láttuk, a 3 portugál találat most is megvolt, viszont magyar részről elmaradtak a gólok. De nem csak a gólokat hiányoltam a csapattól.

 

 

 

 

Számomra (laikus nézőként, szurkolóként, nem szakedzőként) nagyon enerváltnak tűnt a legtöbb magyar játékos, mintha nem lenne tétje a meccsnek (vagy pont ellenkezőleg, túlságosan is nagy volt sokak/egyesek számára?), így amolyan edzőmeccs hangulatú és tempójú játékot kaptunk.

 

Nyilván ráfoghatjuk ezt a taktikára is. Most nem semleges pályán játszottunk, így az "idegenben inkább védekezünk, aztán majd csak akad 1-2 kontra, meglátjuk, akár az x is jó lehet..." mentalitás is lehet, hogy elvárás, s ezáltal a terv része volt, amelyet az 5 védős kezdőfelállás is igazolhat, viszont volt 1-2 játékos (pl. Szalai Ádám) aki kiugró teljesítményt (pozitív értelemben) mutatott.

 

Miért csak kevesen, s mi volt a többiekkel? A transfermakt.de portálon lehet tájékozódni az egyes játékosok aktuális (és korábbi) piaci értékéről, illetve a lejátszott meccsek statisztikáiról, pl. hogy ki mikor és mennyit játszott (játszott-e egyáltalán) az utóbbi időszakban a klubcsapatában, adott-e gólpasszt, vagy szerzett-e gólt, stb.

 

Megnéztem a kezdőből azokat, akiknek a játékot kellene szervezni, az utóbbi időben ki-hogyan teljesített a saját klubcsapatában a bajnoki meccseken (zárójelben írtam, hogy mennyiszer játszottak az utóbbi 6 bajnoki meccsből): Dudzsák Balázs (4/6), Gera Zoltán (5/6), Nagy Ádám (3/6).

 

Közülük Nagy játszik egyedül topligában (Olaszországban), de az utóbbi időben csak minden második meccsen lépett pályára.

 

És mi a helyzet Szalaival? Miért is volt képes szinte egymaga végig "birkózni" a meccset? Az ő meccsaránya 6/6 volt. Tehát sorozatban pályára lépett, még ha több alkalommal csereként is, de hétről-hétre számítottak a játékára (aminek biztos meg van az oka, alapja).

 

De a meccsterhelés adatok mellett nagyon fontos lehet még az aktuális edzettségi állapot, a kondíció is, hogy milyen a játékosok fizikai-erőnléti állapota, mert a két adatforrás integrációja biztosíthat csak olyan alaposabb elemzést, amely hatékony döntéstámogatást nyújthat az edzők számára, pl. egy kezdőcsapat és/vagy a taktika összeállításához (pláne, ha védekező játékot tervezünk, amely sokkal több energiát igényel a játékosoktól).

 

A szövetségi kapitány már több alkalommal jelezte, hogy információ hiány van a játékosok erőnléti állapotát illetően, pl. 2016. augusztusában:

 

"A kluboknál az anaerob mozgások adataira koncentrálnak, én viszont mindenekelőtt az alapokkal, az aerob mozgások teszteredményeivel akarok tisztában lenni. Itt dől el, hogy valakinek milyen a kondíciója, képes-e egy nagy erőkifejtés után gyorsan visszatérni a pulzusszáma alacsonyra."... Storck megjegyezte, általában azt látja az Eb-keret tagjain, hogy fáradtak, nem véletlen, hogy többen meg is sérültek.

 

vagy pár nappal a mostani meccs előtt:

 

"Storck ugyanis azzal szembesült, hogy a fizikai állapotfelmérésre és a terhelhetőségről visszajelzést adó laktát-teszteket hiába kérte el a kluboktól, nem mérték azokat."

 

Egy gyártóüzemben vagy egy kereskedelmi cégben ha a vezérigazgató kér egy riportot, vagy dashboard-ot, akkor nem hinném, hogy sok kolléga maradna a rendszerben 1-1,5 év után is, ha az adott kulcsmutatót (és a hozzá szükséges méréseket) nem tervezik meg, s nem generálják le.

 

De akár egy autóvezetési példán is illusztrálható ez a vezetők számára eléggé kockázatos szituáció, ha mondjuk nem lenne sebességjelző a műszerfalon, elég nehézkes volna az egyéb tényezők alapján (pl. elsuhanó fák "sebessége", a közlekedés többi résztvevőjének a visszajelzése ilyen-olyan stílusban?) megállapítani, hogy éppen mennyivel is haladunk?

 

Az autónál a gyártó felelőssége a kalibrált, megfelelő minőségű és teljességű műszerek műszerfalba építése az autóba, viszont az üzembentartónak és a gépjárművezetőnek jelezni kell a tulajdonos felé, ha a mutató vélhetően rossz, s ellenőrzésre, javításra van szükség.

 

Egy vállalat esetében alapvető fontosságú megfelelő részletezettséggel specifikálni, hogy milyen funkciót is kell beöltenie az adott mutatószámnak/dashboard-nak, s majd az alapján lehet akkor megtervezni, kivitelezni és használatba venni (megfelelő projektmenedzsment esetén pedig jelezni és kezelni a fejlesztés során jelentkező problémákat).

 

Az MLSZ esetében az NB1-es klubokat utasítani lehetne arra, hogy a játékosokról milyen paramétereket, s milyen rendszerességgel kell (és nem opcionálisnak tekintve a válaszadást) mérni és átadni az MLSZ számára. Az adatközlésre és adatelemzésre pedig jobb esetben nem email-en átküldött táblázatokat és táblázatkezelőt kellene használni, még mielőtt ... inkább merjünk tanulni más szakmáktól, területektől, vagy sportágon belül néznénk meg a legjobb példákat (amely akár még vb győzelmet is érhet).

 

Itt volna tehát az ideje, hogy adatvezérelt módon (tényszerű, mérési adatokon alapuló döntésekkel, s ne csak 1-1 kiváló szakember megérzése, ösztönössége, s részadatok, vagy félinformáció alapján) történjen a hazai futball szervezése, vezetése, pláne az utánpótlás bázis fejlesztését tekintve ...

 

Vagyis ne csak ésszel, de ne is csak erővel, hanem a mindenkori fizikai-pszichikai képességeket a rendelkezésre álló technológiákat alkalmazva hatékonyan felmérve és kielemezve rakjunk össze jó csapatot és focizzunk, egyre okosabban, erősebben, s remélhetőleg eredményesebben. Hogy az éjjel még ne érjen véget ...

 

 

Szólj hozzá!

Jó munkát!

2017. január 27. 13:03 - Dr. Pach Ferenc Péter

Szól minden reggel buzdításként, amikor elköszönünk egymástól a munkába, iskolába menet. De mire is gondolunk, miközben ezt mondjuk?

 

"Mit jelent, hogy valaki jó munkát végez? Egyszerűen csak annyit, hogy kellő szakértelemmel teszi a dolgát? Esetleg abból áll, hogy hírnévhez és pénzhez juttat minket?" Teszi fel a kérdést Csíkszentmihályi Mihály, a flow-elmélet atyja, a boldogság és kreativitás egyik legismertebb kutatója. Jó munka című könyvének az alcíme: "Amikor a kiválóság és az etika találkozik". Hm...

 

Dolgozzon, vagy tanuljon bármilyen területen is az ember, előbb, vagy utóbb ráébred, hogy e két dolog együttes jelenléte (vagy éppen hiánya) eléggé szembeötlő módon felismerhető a mindennapok sűrűjében. Olyan ez, mint amikor a hűvösebb reggeleken a pára kicsapódik a kerti asztalra, nyoma van, szemmel is láthatóan.

 

minta_2.jpg

 

Egyik "kedvenc" szituációm az, amikor valaki egy-egy üzleti döntést és az abból következő cselekményt (olyat persze, amely etikailag igencsak megkérdőjelezhető) azzal igazol (vagy éppen fed el), hogy hiszen szóbeli megegyezés született róla, hogy így és úgy kell tenni, ezért és azért történik most ez, s majd így és úgy is lesz, tehát minden rendben van az adott dologgal, mert ugyanis "gentlemen's agreement"-ről van szó.

 

Valóban jó dolog a szóbeli megállapodás, gyors és hatékony tud lenni, már ha valóban úriemberek között történik, pláne, ha az illetők az adott esemény után is megmaradnak annak. De sok esetben valamiért mégsem ez történik...

 

Nekem az ilyen szituációkban mindig egy nagyon sajnálatos (de ugyanakkor mindenki számára kellően tanulságos) eset jut az eszembe, a Turkish Airlines 981-es járatának katasztrófája. Egy DC-10-es repülőgép zuhant le (346 ember halálát okozva!) egy korábban már felismert (és egy másik balesetet is okozó) tervezési hiba elmulasztott kijavítása (a hatóság felől ki nem kényszerített kijavítása) miatt. Szóbeli megállapodás és ígéret volt persze, hogy javítják majd a raktérajtó hibáját a javítási utasítás szerint, de látjuk mennyit ért ez esetben az adott szó... A konkrét esetről és a "gentlemen's agreement" hatásáról bővebben is olvashatunk könyv formájában.

 

Persze lehetne még beszélni az (üzleti) etika kapcsán számos egyéb témáról is, amely minden iparágban jelen van, pl. a korrupció és a versenyképesség összefüggéseiről, a kartellezésről kicsiben és nagyban, vagy hogy mi viszi valójában előre a gazdaságot és mi a tényleges gátja a tényleges fejlődésnek (pl. a Transparency International legfrissebb jelentése szerint "Másfél évtizede mélyrepülésben a magyar versenyképesség").

 

De akár arról is lehetne külön hosszasan értekezni, hogyan lehet és kell ezt a témakört (pl. a csalás-felderítés, a fraud detection területhez hasonlóan) kutatni és hogyan kell interpretálni a feltárt összefüggéseket, aztán olvasói oldalról miként lehet értelmezni (félreértelmezni, vagy éppen félremagyarázni) egy ilyen kutatás eredményeit. Természetesen adatelemzési és nem politikai szemszögből megvizsgálva ezeket, a közelmúltban erre is volt egy-két érdekes példa (pl. a korrupcióról) és eszmecsere (pl. a közbeszerzések kapcsán)?

 

Azonban véleményem szerint elsősorban a legtöbbet azzal tehetünk önmagunk, családunk és társadalmunk hasznáért, ha mindenki a saját feladataiban igyekszik szakmailag a legjobb teljesítményt nyújtani, s erre fókuszálunk. Ezen lesz ugyanis csak áldás, s ez hozza meg az eredményeket.

 

Ügyeljünk tehát erre a 2017-es év minden (nem csak munka) napján, törekedjünk a szakmai kiválóságra, fejlesszük magunkat folyamatosan és a szakmai, etikai szempontokat együtt mérlegelve, alaposan átgondolva hozzuk meg a döntéseinket (ne csak a most-ban gondolkodva, hanem időben és térben is messzebb tekintve vizsgáljuk meg döntéseink és munkánk esetleges hatásait).

 

Jó munkát mindenkinek! :-)

Szólj hozzá!

Év végi "boltjárás" és időjárás

2016. december 14. 18:37 - Dr. Pach Ferenc Péter

Az év végi hajtás mellett, az ünnepi készülődéssel járó bevásárlás is jelentős "logisztikai" fejtörést okoz sokunk számára.

 

Bizony sok tényezőt kell figyelembe vennünk, amikor eldöntjük, hogy mit hol és mikor vásároljunk, egyedül, vagy éppen a párunkkal közösen bonyolítsuk-e le a vásárlást, egy alkalommal tömbösítve, vagy pár alkalomra elosztva intézzük azt?

 

Ráadásul még a napokban elég cudar időjárási körülményekre is fel kell készülnünk: eső, szél, hóesés, ónos eső, hol ez, hol az, hol itt, hol ott.

 

idokep.png

 

 

Választhatjuk persze az online vásárlást is, ahogy teszik ezt egyre többen, évről évre, egyre nagyobb termékkörben, de még mindig van olyan, amit személyesen akarunk megvenni (valakinek a vásárlási élmény számít, valaki pedig a biztos ami biztos alapon teszi ezt: ki tudja időben megjönne-e a csomag...).

 

Nem megnyugtatásképpen, de a másik oldal, a kereskedők is elég jelentős mértékben ki vannak téve az időjárásnak. Becslések szerint az éves forgalmuk akár 3-5%-át is befolyásolja az időjárás (amely akár így azt is eldöntheti, hogy nyereséges, vagy veszteséges lesz egy időszak). Vagyis egyáltalán nem mindegy, hogy mikor, mit és hogyan rendelnek, raktároznak, készleteznek, s már az sem, hogyan is és milyen időzítéssel hirdetnek a potenciális vásárlóik számára.

 

Akadnak kereskedő cégek akik már megvizsgálják, hogy egy a szokásosnál hidegebb, vagy éppen melegebb pár napos időszak milyen módon függhet össze az értékesítési teljesítményükkel de vannak átfogóbb kutatási eredmények is a témában. És nem meglepő módon az időjárás kihat még az online értékesítésre is: napos időben ugyanis csökkenő értékesítés a jellemző.

 

De vannak már olyan szolgáltatók is, akik egy-egy szektorra, vagy régióra vonatkozóan időjárás előrejelzéseket értékesítenek a kereskedők számára, vagy akár automatizált figyelmeztetést is tudnak nyújtani a nem várt, extrém változásokra.

 

Hiszen ahogyan a korábbi bejegyzésekben is láthattuk már, az időjárás adatoknak nagy értéke van...ahogy az időnek, az időnknek is.

 

Éppen ezért nem csak kellemes, hanem eredményes időtöltést, "boltjárást" is kívánok az ünnepi készülődéshez, legyen akármilyen az időjárás!

2 komment

Egy választás margójára: közvélemény kutatás?

2016. november 09. 22:17 - Dr. Pach Ferenc Péter

Az adatok felhasználhatóságának időbeli korlátai 2.0

Miért is érdemes a tritoo blogot olvasni és megosztani?

Az élet szüli a legjobb példákat, legutóbbi blog bejegyzésemhez kapcsolódóan a legfrissebb példa, hogy miért is kell nagyon óvatosan bánni a historikus adatokkal: Az USA-ban "Guam szigetén 1980 óta mindig az az elnökjelölt nyert a szavazáson, akit utána tényelegesen elnökké választottak." Igen? Egészen a tegnapi napig!

Ahogy már megfogalmaztam, "a múltra vonatkozóan mindenképpen csak egy véges adathalmazt tudunk elérni és felhasználni (hiszen amit gyűjtöttünk, rögzítettünk, letároltunk vagy esetleg külső adatforrásból integráltunk, az a valóság csak egy kis szelete, legyen az adathalmaz bármilyen kiterjedt, komplex és nagy méretű), de viszont a jövő a végtelen számosságú lehetőségek halmaza (hiszen bármilyen eshetőség megtörténhet, adott valószínűség mellett)..."

És a hangsúly pont azon kellene, hogy legyen egy-egy ilyen "előrejelzésben" (pláne annak publikálásában, megosztásában) hogy a nem ismert (vagy eddig elhanyagolt) egyéb tényezőket, módszereket és eszközöket is figyelembe kell vennünk valamilyen módon a modellezésünk során. Nyilván a kereslet, vagyis az érdeklődés még nem vezet egyértelműen a "vásárláshoz", de azért nem figyelembe venni és helyette kizárólagosan korábbi adatok és eszközök, módszerek alkalmazásával kimondani előre, hogy a, vagy b...hát az ilyen helyzethez vezethet...

trends.png

 

Ha további hasznos példákon keresztül szeretnénk egyre többet tanulni az adatelemzés világáról, és az elemzéshez szükséges szemléletmódot elsajátítani, legyünk akár adat, vagy projekt gazdák, vagy akár még a közvélemény kutatásban dolgozók is, olvassuk rendszeresen ezt a blogot!

Ha valakinek pedig kérdése volna, vagy már konkrét segítségre, tanácsadásra lenne szüksége az adatelemzésben, akkor keressen bizalommal elérhetőségeinken: www.tritoo.hu

1 komment

Az adatok felhasználhatóságának időbeli korlátai

2016. október 25. 12:26 - Dr. Pach Ferenc Péter

Bizonyára sokan tapasztalhattuk már azt, amikor pár év távlatából visszatekintünk egy korábbi munkahelyünkre és az akkori csapatra, hogy az idő múlásával a régi csapatból már csak kevesen dolgoznak ott, esetleg ők is már teljesen más területen, munkakörben és a korábbi oly fontos és sürgős feladatokat, projekteket és persze az elért eredményeket a jelenleg ott dolgozók esetleg már hírből (vagy még anekdotákból) sem ismerik.

Sok esetben kizárólag csak az adatok maradnak hátra, jobb esetben persze még a korábbi elemzések, modellek is, akár még megfelelő minőségű és mennyiségű dokumentációval is.

Pedig a korábbi adatelemzések és modellezések által megszerzett tudás (és ez itt természetesen nem üzleti/technológiai know-how, vagy egy-egy konkrét algoritmus szintjén értendő), tapasztalatok formájában hosszabb távon is felhasználható volna.

 

levelek.jpg

 

Az idősorok vonatkozásában azonban kellő óvatosság szükséges, mert hiába áll rendelkezésre több évre visszamenőleg egy idősor, a korábban érvényesnek és hasznosnak tekintett adatok felhasználása a jelenre (pl. az aktuális helyzet leírására) és a jövőre (pl. predikciós modellek elkészítéséhez) vonatkozóan is behatárolt.

 

Nagyon fontos megérteni és különbséget tenni a rendelkezésre álló adatok esetében, hogy mit, mire mikor és meddig használhatunk fel egy adott elemzési cél érdekében. Iparáganként (és bizony projektenként is) más és más az az időhorizont, amelyen belül még érvényesnek és használhatónak tekinthetjük az ún. historikus adatokat.

 

Adott vállalat belső működési viszonyainak (pl. a termékek, vagy szolgáltatások bevezetési/kivezetési ideje, promóciók típusa, időpontja, vagy egy adott gyártósoron a módosítások jellege és időpontjai, vagy egy alapanyag - de akár a beszállító - megváltozásai is, stb.) és a piaci viszonyok (pl. a piac méretének a változása, a piaci szereplők számának alakulása, vagy a jogszabályi környezeti megváltozása, stb.) ismerete nélkül egyrészt pazarlóan járnánk el, másrészt felelőtlenül is, hiszen hibás következtetésekhez vezethet, ha rosszul választjuk meg az elemzés vagy modellezés időhorizontját.

 

Attól, hogy ma már a rendelkezésre álló technológia és az alkalmazható eszközök lehetővé tennék akár az összes vonatkozó és elérhető adat felhasználását, egyszerre történő elemzését, mégsem az az ajánlott megközelítés, hogy in medias res látunk neki egy elemzésnek, modellezésnek.

 

Még mielőtt bármit is kezdenénk az elérhető adathalmazzal, elsőként azonosítanunk kell azokat a belső és külső viszonyokat, hatásokat, változásokat, amelyek megszabják azt, hogy milyen időhorizontokban is gondolkodhatunk egy-egy elemzés, modellezés esetében. Éppen ezért nagyon fontos tudnunk, hogy a szakterület kellő ismerete (illetve megismerése és bevonása) nélkül pl. egy előrejelző modell is csak elméletileg és maximum "laborkörnyezetben" működhet jól, valós (üzleti/kereskedelmi/ipari) környezetben semmiképpen.

 

Fentiek mellett figyelembe kell vennünk még azt is, hogy a múltra vonatkozóan mindenképpen csak egy véges adathalmazt tudunk elérni és felhasználni (hiszen amit gyűjtöttünk, rögzítettünk, letároltunk vagy esetleg külső adatforrásból integráltunk, az a valóság csak egy kis szelete, legyen az adathalmaz bármilyen kiterjedt, komplex és nagy méretű), de viszont a jövő a végtelen számosságú lehetőségek halmaza (hiszen bármilyen eshetőség megtörténhet, adott valószínűség mellett). Éppen ezért a historikus adatokra épülő megoldások lehetőségei is behatároltak (lásd pl. a tőzsdei előrejelzések esetében).

 

Például az osztályozási feladatok esetében sem mindig a legtöbb elérhető adatra támaszkodó és/vagy a legpontosabb osztályozó algoritmus a legjobban alkalmazható egy modellben, hiszen ha fontos, hogy valós időben adjon a modell egy relatíve pontos kimenetet (pl. mozgásnem detektálása okos telefonnal, vagy objektumok típusának a felismerése önvezető autók esetében), akkor a gyorsabb, de relatíve (csak kis mértékben) pontatlanabb modell sokkal értékesebb a konkrét osztályozási probléma megoldásában.

 

Ezért nincsen olyan (még ha sokan esetleg ezt is állítják és hirdetik), hogy legjobb elemzés, vagy legjobb modell, hanem csak az adott konkrét (üzleti/kereskedelmi/technológiai) problémára és konkrét célra helyesen létrehozott és igazoltan jól működő modell, amelyet aztán persze időszakosan felül kell vizsgálni (mert lehetséges, hogy javítani, vagy módosítani kell, vagy esetleg ki kell terjeszteni).

 

Mert minden változik...

 

1 komment

Mintázatok mindenhol: az időjárás hatásának a lenyomatai egyéb adathalmazokban.

2016. szeptember 27. 12:55 - Dr. Pach Ferenc Péter

Egy nagyon népszerű portálon élőben nyomon követhető a légi forgalom, melyik járat éppen hol tart, milyen magasan és milyen gyorsan repül. Délutánonként, napsütéses időben, mi is gyakran szemlézzük a teraszról, hogy éppen milyen gép is száll el felettünk, s persze kisfiamnak a fő kérdés minden alkalommal az, hogy mikor is jönnek azok a szép nagy "Dubai-i" gépek.

 

Az észlelésen túl a menetrendi adatokat (Frankfurt és München 15.00 utáni indulásokkal) is tanulmányozva láthatjuk, hogy nem véletlen, hogy nagyon sok esetben egymáshoz közeli időpontra esik 2 db Airbus A380-as átrepülése a Balaton térségében, olykor igen szép mintázatot alkotva az égen (és minden bizonnyal a járatok adatait tartalmazó idősorban is):

 

41c6088231e0ff918ee2909328d637d0.jpg

 

 

Várakozva a "Dubai-i" gépekre még érdekesebb megfigyeléseket is tehetünk, például a Budapestre leszálló gépeket vehetjük szemügyre, mert a Balaton középvonala felé teszik meg ereszkedő útjukat a reptér felé haladva. Viszont borúsabb, vihar közeli időben van, hogy hiába várjuk a megszokott útvonalon az ereszkedő gépeket. A szokásostól eltérő dolgot tapasztalunk. Ennek oka az, hogy már egy alacsonyabb sebességgel haladva nyilván nem célszerű 5.000 m körüli magasságban, ereszkedés közben belerepülni egy zivatar cellába.

 

Az alábbi ábrákon (a flightradar24.com és az idokep.hu portálokról) erre láthatunk egy konkrét példát, amikor egy Budapestre tartó járat a zivatar cellák miatt elég nagy kitérőt tett már a magyar légtér elérése előtt, így a járat útvonalának szokásos mintázatát nem követte ez a trajektória. Nyilván ez a járat rész/menetidejének növekedésével (és esetleg késéssel is) járt.

 

wizzair.png

 

 

wizzair_w.png

 

 

A példában mutatott időjárási körülmények azonban nem befolyásolták a magasabban (~ 12.000 m felett) repülő gépek útvonalát (így a Dubai-i gépek is a "megszokott" útvonalon haladtak el aznap délután, átrepülve a felhők felett).

 

Viszont a zivatarfelhő típusától, kiterjedtségétől függően még ebben a nagyobb utazómagasságban is sor kerülhet kitérésre, kerülőre. Még a "Dubai-i" járatok esetében is volt erre példa a közelmúltban, 2016.09.13-án. Ekkor a máskor egymáshoz nagyon közeli trajektórián haladó gépek közül mindegyik másfelé került (így aznap nem is láthattuk őket szabad szemmel). Olyannyira nagy zivatarfelhő volt ez egyébként aznap délután, hogy a járatok útvonalán, a földön is megtette a hatását, például Pakson özönvíz-szerű esőzés volt (további képek).

 

Az időjárás miatti késések a repülőgép járatok historikus adataiban is tetten érhetőek (a konkrét esetekben 6 óra 5 perces lett az út a kerülő miatt a frankfurti járatnál, a müncheninél pedig 5 óra 45 perces, amelyek több mint + 15 percet jelentenek az átlagos időtartamhoz képest).

 

A járatok késései pedig elég nagy gondot okoznak az utasoknak és a légitársaságoknak is világszerte, így a késések okainak feltárása és elemzése is fontos.

 

Aki szeretne jobban is elmélyedni a témában, s bővebb elemzéseket, vagy akár előrejelzéseket készíteni, annak ajánlom pl. ezt a valós járat adatokat tartalmazó adatsort és ezt a use case-t is, ahol egy konkrét megoldást ismertetnek (Hadoop és Python felhasználásával) az előrejelző modellek elkészítésére lépésről lépésre.

 

Tehát, elemzésre fel, keressünk érdekes (időjárás okozta) mintázatokat az adathalmazokban!

Szólj hozzá!

Az időjárás adatok értéke

2016. szeptember 13. 11:04 - Dr. Pach Ferenc Péter

Miért költött el az egyik legnagyobb IT vállalat több, mint 2 milliárd dollárt egy időjárással foglalkozó cég felvásárlására?

 

Azért mert az időjárás adatok bizony hatalmas adatvagyonnak számítanak, no de miért is és kinek a számára?

 

Az utóbbi hetekben a közösségi médiában egyre több bejegyzést is olvashattam arról, hogy egy magyarországi népszerű üdülőkörzet térségében nagyon gyakran terjeng valamilyen furcsa szag, bűz. Mondanom sem kell, hogy ez jelentős mértékben megkeseríti az ott élők életét (főként a nyári időszakban, ahol még nyaralók ezrei is érkeznek oda pihenni, kikapcsolódni, akár mint fizetős szállóvendégek).

 

A szagkibocsátás a lakosság által feltételezhető forrása egy a közelben lévő hulladéklerakó telep nem előírás-szerű működése, azonban erre kevés a konkrét tárgyi (adatokkal kellőképpen alátámasztott) bizonyíték a kezükben. A hatóság által készített vagy elvárt mérések és abból az elemzések a területen uralkodó szélirány és szélsebesség adatok alapján a lerakó szaghatását a környező lakóterületekre nem igazolták. Viszont ezzel szemben a lakosság számos esetben érzékelte a szaghatást, akár több kilométerre is a feltételezett szagforrástól. Miért van ez a látszólagos ellentmondás?

 

Utánajárva kicsit az ilyen környezeti hatástanulmányoknak (általánosan és a konkrét ügyben is megismerve a kalkulációkat, s az elvégzett modellezéseket) gyorsan megállapítható, hogy mivel hazánkban jelenleg nincsen szabályozva és ezáltal előírva egy ilyen elemzés és modellezés elvárt tartalma, így annak módját és mélységét az elemzést és modellezést végzők határozzák meg (jobb esetben nem ad hoc kitalált módon, hanem valamilyen szakirodalmi forrás alapján).

 

Ez a helyzet kicsit olyan, mintha mondjuk egy gyógyszerfejlesztési projektben a klinikai vizsgálatok adatainak a kiértékeléséhez nem szabályoznák le előre azt (illetve ún. guideline-okat sem adnának a hatóságok), hogy milyen típusú vizsgálatnál milyen statisztikai módszert kellene alkalmazni (mindenki azt használná amit szokott, amit ismer, vagy éppen aznap szeretne használni, s persze így nagyon könnyen jöhetnek ki inkonzisztens eredmények akár egy megismételt elemzés során is...).

 

De akkor mit tehet ilyen esetben a lakosság, hogy a probléma lehetőleg mielőbb megoldódjon?

 

Egyrészt például szakmailag helyes kérdéseket fogalmazhat meg, elsősorban a hatóság felé, az eddig elvégzett, vagy elvégeztetett elemzésekkel és modellezésekkel kapcsolatosan (igénybe véve egy tapasztalt adatelemző segítségét). Konkrétan: 1. Milyen időjárás forrásadatokból és miért éppen azokból készítették az elemzéseket?, 2. Miért az átlagos (éves eredő) szélirányt és szélsebességet vették csak figyelembe, s miért nem alkalmaztak pl. heti/havi/negyedéves bontásokat, vagyis miért csak egy db éves szélrózsát készítettek el azt is csak egy db paraméter kombinációval (mintha csak egy statikus rendszert vizsgálnának...mintha sosem változna pl. a szagkibocsátás intenzitása, a hulladék mennyisége, stb.)? 3. Végeztek-e vizsgálatot arra vonatkozóan, hogy pontosan milyen a mérési adatsor varianciája (mondjuk egy napon belül mennyire nagy a szélirány és szélsebesség szórása), s olyat, hogy mennyire jellemző az idősorokra a szezonalitás (nyáron a magasabb környezeti hőmérséklet hatására nem lehetséges- hogy megváltozik a térségre jellemző széljárás)? 4. Milyen egyéb időjárási tényezőket vizsgáltak meg, vagy éppen nem vizsgáltak meg (hőmérséklet, páratartalom, légköri nyomás, stb.), amelyek esetleg hatással lehetnek a szag terjedésére?

 

A kérdések megfogalmazásán (és megküldésén) felül, célszerű meglévő adatforrásokat keresni, illetve új adatforrásokat is képezni: azért, hogy a geolokációs, meteorológiai és az észlelési adatokat össze tudjuk majd kötni, hiszen az észlelések és az észlelések időpontjában aktuális időjárás viszonyok a környéken egy térképen elhelyezve egyértelműen kijelölik a szagforrás lehetséges helyét (egy pár négyzetkilométeres területre is elegendő már pontosítani azt). A releváns meteorológiai mérőállomások adatait kell elsősorban megkeresni (amely nem egyszerű, mert pl. Magyarországon csak kb. egy tucat olyan állomás van - OMSZ -, amelyek adatai elérhetőek, s ráadásul fizetős szolgáltatásként) , illetve egyéb automaták adatait is lehet keresni, viszont tanácsos inkább olyan ún. open data forrásokat használni, ahol elérhetőek hisztorikusan is az időjárás adatok a kérdéses területre (minimum a szélsebesség és a szélirány), mint pl. a Windyty portálon ahol egy remek animáción is láthatóak a jelenlegi, vagy pedig a múltbeli időjárási körülmények (a mérési adatokból szimulációval képzett értékek tetszőlege helyszínre vonatkozóan).

 

Aztán az ún. meta-információt, illetve segédleteket sem árt keresni a témához, amelyek az ún. domain tudásunk bővítésén túl hasznosak még abban is, hogy konkrét példákat találhatunk arra vonatkozóan, hogy az eddig csak szeparáltan itt-ott elhelyezett (vagy írásos formában akár nem is rögzített) szagészleléseket hogyan és miként célszerű összegyűjteni: a leghatékonyabb egy a közösségi médiában is megosztott szagészlelés napló (amelyben rögzíthető a szagészlelés helye, ideje, időtartama, intenzitása stb.).

 

A megfelelő adatforrások megtalálása és leképzése esetén a következő fázisban jöhet már a konkrét adatelemzés is (milyen összefüggést találunk az egyes észlelések ideje, elhelyezkedése, illetve az időjárási adatok között). Amely szintén nem kis munka, ha megfelelően végezzük el (adatok tisztítása, integrációja, megfelelő modellek kiválasztása és alkalmazása, az eredmények ellenőrzése majd vizualizációja és közreadása), de álljunk meg egy pillanatra...

 

... kanyarodjunk csak vissza a bejegyzésem elején feltett kérdéshez.

 

És képzeljük el azt, hogy van egy olyan applikáció, amelyet letöltve minden felhasználó/lakos megoszthatná a telefon szenzorai által mért adatokat (aktuális GPS adatok, hőmérséklet, légnyomás, stb.) plusz a saját maga által érzékelt, észlelt környezeti hatásokat (pl. a szagok jelenlétét is). Elegendő volna csak egy-két "gombnyomás" az alkalmazásban, hogy az észlelés kezdete, típusa, vége információ mind megosztásra kerüljön egy adatközpontba...utána pedig az összegyűjtött adathalmaz valós időben automatikusan feldolgozásra kerüljön, hogy az összefüggéseket valós-időben láthassuk, így ha valamilyen környezeti probléma adódik, akkor a hatóságok és hivatalok a kellően hatékony lépéseket időben megtegyék és ne hónapok, sőt évek teljenek el...igazi eredmények nélkül.

 

De szép is lenne...addig is tegyünk érte mi, s használjuk ki az open data és a közösségi média nyújtotta lehetőségeket!

 

Várom az esetleges hozzászólásokat, észrevételeket, kérdéseket!

Szólj hozzá!

Maradjunk két lábbal a földön...

2016. augusztus 26. 10:18 - Dr. Pach Ferenc Péter

Lassan véget ér a nyár, közeledik az ősz, de erről, mármint az évszakok (szezonok) változásáról egy-egy elemzés során elfeledkeznek. Márpedig nem csak leíró, hanem az előrejelző, de még az ún. perspektivikus elemzéseknél is hatalmas hibákat lehet ezzel a "feledékenységgel" elkövetni.

 

Rengeteg területen alapvetően fontos volna, hogy figyelembe vegyék az úgynevezett szezonális hatásokat és a ténylegesen mérendő/kimutatandó hatások megismeréséhez, először is a mért/gyűjtött adatok korrekciójára lenne szükség. Vannak természetesen olyan iparágak, ahol (jó esetben) már alapkészség szintjén alkalmaznak ún. idősor dekompozíciós módszereket, amelyekkel a szezonális hatásokat el tudjuk különíteni a mérendő egyéb hatásoktól, így azok nem zavarnak be az adatok kiértékelése során (pl. a kereskedelemben a forgalom előrejelzési/becslő modellek alkalmazása esetén).

 

Viszont akár még mérnöki területeken és feladatokban is előfordulnak olyan esetek, ahol elfeledkeznek erről (mert még nem olvastak, vagy nem hallottak róla, vagy egyáltalán nem is gondoltak rá... - nem is tudom melyik a rosszabb -).

 

Vegyünk egy példát, ahol a mérnök kollégáknak egy új talaj szenzor rendszert kell kifejleszteni, a talajban bizonyos fizikai paraméterek mérésére (pl. a talaj hőmérséklete különböző mélységekben). A tervek szerint a mérési adatokat egy irányítórendszer is felhasználja majd, amely automatikusan bizonyos beavatkozásokat végez el a talajban (pl. egy megadott anyagot injektál bele). Viszont ezeknek a beavatkozásoknak a szükséges mértékét az irányítórendszer a szenzoroktól kapott adatok alapján határozza meg.

 

Tehát nagyon fontos volna, hogy a szenzorok pontosan azt mérjék (és olyan tartományban), amely változásokat/hatásokat ki szeretnénk mutatni. Egyáltalán nem mindegy az, hogy pl. hőmérséklet szenzorok esetében milyen kis mértékű változás a számunkra szakmailag releváns mértékű változás: 1, vagy 2, vagy csak 0,2 Celsius fok? Milyen mértékű hőmérséklet változások esetén kell az irányítórendszernek beavatkoznia? És milyen mélységben figyeljük meg ezt a hőmérséklet változást? Előfordulhat, hogy különböző mélységekben más és más a releváns mértékű változás?

 

És akkor itt jön be az a szempont/gondolat (szerencsés esetben még a tervezés során), hogy mi az, ami befolyásolhatja a talaj hőmérsékletét, mindenféle beavatkozás nélkül, vagyis milyen alapvető hatások lehetnek, amelyekkel mindenképpen számolnunk kell?

 

Ilyen hatás például a talaj természetes hőingadozása. Ok, de mégis hol a Föld mely részén, milyen éghajlati övezetben mérjük meg? És milyen mélységekben? Az attól függ, hogy hol szeretnénk alkalmazni majd a kifejlesztett szenzort. Ha globálisan és többféle mélységben is szeretnénk majd a rendszert használni, akkor bizony az installálás (és a kalibrálás) során meg kell adnunk ezeket a paramétereket is, hogy éppen hol is lesz telepítve az adott rendszer. De a paraméterezéshez szükségünk van az adott helyszínről származó előzetes mérési adatokra, amelyek lehetnek saját mérési adataink, vagy egy külső adatforrást is felhasználhatunk hozzá.

 

Ha már rendelkezünk megfelelő minőségű és mennyiségű előzetes mérési adattal, pl. mérsékelt éghajlati öv esetén egy fix mélységben (pl. 1,5 m), minimum 3 különböző mérési pontban (3 azonos típusú, de egymástól független szenzorral) mért egész éves idősorral, (pl. 4 mérés/nap mintavételezési frekvenciával), akkor ezt az idősort felbonthatjuk ún. trend, szezonális és véletlen hatásokra. Amely komponensek közül (az irányítórendszer helyes tervezésének és fejlesztésének a szempontjából) a legfontosabb a véletlen komponens lesz. Mindenféle beavatkozás nélkül is lesz egy valamilyen mértékű véletlen ingadozásunk, amely azonban már nem a talaj természetes hőingadozása, hanem egyéb befolyásoló tényezők hatására változik (pl. a leáramló csapadékvíz aktuális mennyisége a szenzor közelében) és kisebb nagyságrendű, mint a természetes ingadozás amplitúdója. A tervezett beavatkozás visszamérendő hatását ezen véletlen komponens szórás adatai alapján jelölhetjük ki: 0,1, vagy éppen 0,3 Celsius fok az a hatás, amelyet vissza tudunk mérni és nem a véletlen, hanem a mi beavatkozásunk hatása, vagyis az a bizonyos anyag beinjektálása a talajba. Ekkor tudjuk megfelelő módon visszamérni azt, hogy adott anyagmennyiség bejuttatásának mekkora is a valódi hatása, s így kaphat csak valós adatokat az irányítórendszer is (az optimális anyag és energiafelhasználás csak ez esetben érhető el a fő funkciója ellátása során).

 

Azonban nem csak a talajmérésekben, hanem egyéb helyeken, iparágakban is nagyon fontos lehet, hogy az idősor elemzéseinket megfelelő módon végezzük el. Minden olyan esetben, ahol a környezeti hatások nagymértékben hatással lehetnek a mérési adatok változására (pl. külső környezeti hőmérséklet egy vegyipari gyár csőrendszereinél, vagy pl. a páratartalom, vagy akár a rezgés is egy gyártósoron ahol elektronikai eszközöket készítenek) a kellő figyelemmel és gondossággal kezeljük az adatokat az idősor elemzéseink során!

 

Nálatok hogyan történnek az idősorok elemzései? Várom az ezzel kapcsolatos projekt tapasztalatokat, észrevételeket, kérdéseket!

Szólj hozzá!

A külső adatforrások szerepe ..., amikor a tisztánlátás szó szerint is nagyon fontos.

2016. augusztus 10. 14:57 - Dr. Pach Ferenc Péter

Vagyis hogyan "mentsünk meg" egy 700 millió dolláros projektet?

A NASA Plutó-missziójában a New Horizons űrszonda 2015. júliusában, 9 év alatt, több mint 4 milliárd kilométer megtétele után érte el a törpebolygót, hogy arról nagy felbontású képeket készítsen és egyéb adatokat gyűjtsön.

 

A projekt sikerességéhez azonban (a 700 millió dolláron felül) szükség volt még olyan alapvető információra is, amely sem a projekt tervezésekor, sem az űrszonda elindításakor, de még az út legnagyobb részében sem állt rendelkezésre.

 

Mivel a Plutó Nap körüli pályájának csak egy kis része volt ismert az űrszonda elindításakor (egész egyszerűen azért, mert az 1930-as felfedezése óta eltelt évtizedek során a keringési idejének, a 248 évnek még csak kis hányada telt el, így nem volt elegendő mérési adat), ezért a találkozás helyének pontos meghatározása előre lehetetlen volt. Többféle lehetséges pálya ívet határoztak meg, egyet "becéloztak", de hogy melyik a valódi, az még kétséges volt.

 

Márpedig az űrszonda nagy sebessége miatt (a törpebolygóhoz képest relatív sebesség 14 km/s volt) a Plutóról a használható minőségű (megfelelően fókuszált) fotók elkészítése csakis úgy sikerülhetett ha helyes a szonda irányzéka, trajektóriája és az nem halad el túl messze a Plutótól (a felszínétől kb. 12000 km távolságra). Továbbá a találkozás előtti pillanatokban a Földtől való túl nagy távolság (több mint 7 milliárd km) miatt nem lett volna elegendő idő már a szonda pályájának korrekciójára sem (mert ilyen távolságból a rádiójelek több mint 4 óra alatt érik csak el a szondát). Így akár az egész projekt hiábavaló lehetett volna.

 

Mi volt hát a megoldás ez esetben?

 

A tervezett találkozás előtt (amikor tehát még reális esély volt egy esetlegesen szükséges pályakorrekcióra) külső adatforráshoz nyúltak, mégpedig egy obszervatórium több évtizedes, a Plutóról és "környezetéről" (adott rendszerességgel) készített (megfelelő számosságú és minőségű) felvételeit digitalizálták, és azokból egy sorozat-fevétel videót készítve meghatározhatták a Plutó valós pályájának a kérdéses szakaszát.

 

A projekt ezáltal sikeres lett, felbecsülhetetlen értékű információt nyert az emberiség a Plutóról (hozzájárulva, hogy a naprendszerünk kialakulásáról egyre bővebb információval rendelkezzünk). És a történet még nem ért véget, a szonda halad tovább a Kuiper övben és gyűjti, küldi az adatokat a további elemzésekhez...

 

A kisebb léptékű (mind költségvetésben, mind időtartamban) projektekben is legtöbb esetben elengedhetetlenül szükséges (volna), hogy rendelkezésünkre álljanak a belső adatforrások mellett a megfelelő külső adatforrások. Mennyire fókuszálunk és támaszkodunk a külső adatforrásokra? Hogyan integráljuk azokat a már meglévő és elemezni kívánt belső adatokkal?

 

A következő alkalommal egy sokkal inkább "földhöz ragadt" esettanulmányon keresztül részletesen bemutatom, miért nem elhanyagolhatóak a külső információk, s milyen összefüggés van a kimutatandó hatás és a külső adatforrás megfelelő használata között.

 

Addig is várom az ezzel kapcsolatos saját projekt tapasztalatokat, észrevételeket, kérdéseket!

 

(Források és további érdekes részletek: dokumentum film a misszióról, technikai részletek, a misszió honlapja, egyéb érdekességek a projektről, a benne résztvevőktől)

1 komment
süti beállítások módosítása