Hogyan készült a Sasleltár?

Címkék:

Tegnap közzétettük az idei Országos Sasszinkron eredményeit, amiből az érdeklődők megtudhatják, hogy a felmérők hány sast számoltak Magyarországon, mekkora területet vizsgáltak meg és hogyan változott a telelő sasok száma az elmúlt években. Ezen beszámolóban szeretném röviden bemutatni, hogyan történt az adatok feldolgozása, mi történt a beérkező adatlapokkal, hogy lesz a terepi munkát elvégző madarászok által gyűjtött adatokból a hazánkban telelő sasok helyzetét bemutató jelentés.

Ahogy más madárszámláló programok esetében, úgy a Sasszinkront is igyekszünk a sajtó segítségével szélesebb körben ismertetni, a természetvédelem, a természeti értékek népszerűsítése érdekében. Sajtóközleményben tudatjuk a lakossággal, hogy megrendezzük az akciót, majd újabb sajtóközleményben adunk tájékoztatást az eredményekről. Az ilyen hírverés akkor éri el igazán a célját, ha a program lebonyolítása és az eredmények közlése között minél kevesebb idő telik el, hiszen, ha az érdeklődők emlékezetében élénken él a meghirdetett program és hamar tudomást szereznek annak eredményeiről is, akkor nagyobb hatást képes kiváltani az arra fogékonyaknál. Persze ne feledkezzünk meg a résztvevőkről sem, ők ugyanúgy mielőbb meg szeretnék ismerni munkájuk eredményét. Az eredmények gyors közlése tehát fontos, de a pontosságról, megbízhatóságról sem mondhatunk le, ehhez azonban sok apró részletre oda kell figyelni.

A program során használt MS Excel adatlapokon, a korábbi évek tapasztalatai alapján történtek apróbb változtatások, amelyek fő célja a feldolgozás megkönnyítése, gyorsítása volt. Az aktuális verziót 2013-ban vezettük be. A feldolgozás a Microsoft Visual Basic for Applications (VBA) fejlesztői környezetében írt programkód (ún. szkript) segítségével történik. Ez a módszer rendkívül gyors, ám az adatlap szerkezetének megváltoztatására érzékeny, ezért arra kérjük felmérőinket, hogy az adatlap kitöltésekor csak az adatok közlésére szánt üres mezőket használják. Új sorok beszúrása lehetséges, a táblázatban nem szereplő fajok beírása szintén, a többi szürkített mező tartalmának megváltoztatása azonban megnehezíti a feldolgozást.

Így nézne ki egy helyesen kitöltött Sasszinkron adatlap.

 

Az adatlapok feldolgozása

A beérkező adatlapok a feldolgozás során először egy ellenőrzésen mennek keresztül, mely során az adatlap alapvető adatait ellenőrizzük. Ki van-e töltve minden fontos mező, van-e összesítés, a dátum és az időpont megfelelő formátumú-e, azt UTM négyzetek kódja megfelel-e a 6 jegyű formátumnak, stb.?

Melyek az itt előkerülő tipikus hibák és azok hogyan javíthatók? (A konkrét példákban szereplő UTM négyzetek kitalált esetek, az előforduló helyzetek bemutatására.)

  • Az adatlapot már korábban beküldte a helyi koordinátor, vagy éppen a felmérő. – Ekkor az adatlap feldolgozása már megtörtént, így az adott adatlap kimarad.
  • Az összesítés hiányzik. – Jobb híján a feldolgozó kolléga végzi el az összesítést, ő azonban bizonyos felmerülő kérdésekkel nem tud számolni, amivel a felmérést végző igen. Például egy madarat a felmérő két négyzetben is látott és mindkettőhöz jelzi a madár jelenlétét, de az összesítésben természetesen egy madarat jelez. Ilyen esetekben ezért általában fel kell hívnunk az adatközlőt, hogy végezze el az elmaradt összesítést.
  • Egy adatlapon több nap adatait közlik, különböző színekkel jelölve. – Ezt szétszedni elég időigényes feladat, de valószínűleg kitölteni is időigényesebb volt, mint az Excel munkafüzet lapjából újabb példányt beszúrni, és az egyes napokat külön kitölteni.
  • Az UTM négyzet elírása. – Ez okozza a legtöbb nehézséget, ha a megoldás nem egyértelmű, akkor felhívjuk a felmérőt, hogy tisztázzuk az esetet. A legjellemzőbb esetek:
    • 1.EU4B2 – Ilyen négyzet nincs. Ha az adatlapon szereplő többi négyzet jellemzően az EU42 kódrészlettel kezdődik, akkor értelemszerűen javítható.
    • 2.EU4202 – Ilyen négyzet sincs, pedig az eset elég gyakori, a konkrét esetben sokszor a terepen kézzel írt adatlapról a ’D’ jelzést ’0’-nak írják. Előfordul, hogy pl. ’C’ helyett, vagy mellett ’X’, vagy ’V’ szerepel, az adatlapot kitöltő melléütött a billentyűzeten.
    • 3.EU55A3 – Ilyen négyzet nincs. A területe külföldre esne, de a Magyarországon kívüli területekre ez a kódolás nem érvényes, az UTM-ek általunk használt rendszere Magyarországra lett kidolgozva, de előfordul, hogy egy elírt karakter a rendszerbe semmilyen módon nem illeszkedő, nem létező négyzetet „jelöl”.  Az ilyen elírások azonban ennél az ellenőrzésnél nem derülnek ki, mert ekkor még nem lehet minden beírt kódot megkeresni a 15 ezer négyzetet tartalmazó UTM rendszerben.
    • 4.Sajnos előfordul, hogy a felmérő, csak a kód első 4 karakterét adja meg, így egy 10*10 km-es négyzetre utal, véletlenül, vagy akár szándékosan, ám ez igen nehezen elemezhető együtt a többi adatlappal. A programot koordináló Ragadozómadár-védelmi Szakosztály útmutatása alapján a terepi adatok gyűjtése 2,5*2,5 km-es UTM négyzeteken történik, az eredményeket azonban 10*10 km-es UTM-ek alapján közöljük. A felmérőknek tehát felesleges a miatt aggódni, hogy egy-egy sas előfordulása 10*10 km-nél finomabb felbontásban jelenik meg a beszámoló térképein, az elemzések elvégzéséhez azonban szükség van a 2,5*2,5 km-es UTM négyzet kódjára.
  • Az adatlapon egy UTM négyzet többször szerepel.  – Ekkor az a kérdés, hogy a két sor összesíthető-e, vagy valamelyik sorban az UTM kód el lett írva. Egy négyzetnek egyszer kell szerepelnie az adatlapon, ha a bejárás során a felmérő kétszer érinti a négyzetet, a négyzetre történő összesítést szerencsésebb, ha ő teszi meg.

A fent említett példák csak a legtipikusabb eseteket ismertetik, számos egyedi eset előfordult már. Egy hibamentes, vagy csak apróbb hibákkal terhelt adatlap feldolgozása kb. 5 perc. Ha sokat kell nyomozni az elírások után ez akár 15-20 perc is lehet. Így az 50-60 adatlap, amelyeknél erre az idén szükség volt, nagyjából egy-másfél nappal hosszabbította meg az adatok feldolgozását.

Az MS Excel-ben a VBA szkript lefuttatásakor az adatlap tartalma bekerül két adattáblába.

 

A feldolgozott adatlapok adatainak további ellenőrzése az elemzések előtt

Az első ellenőrzés után a VBA szkript lefuttatásakor az adatlap tartalma bekerül két adattáblába, az egyik az összesítéseket tartalmazza, a másik az UTM négyzetekre vonatkozó alapadatokat. Ezen két adatbázis alapos ellenőrzése során kerülnek elő az olyan esetek, amelyek az első ellenőrzéskor nem látszottak. Előkerülnek az olyan UTM kódok, amelyek nem létező négyzetekre mutatnak, illetve ekkor derül ki, hogy mely négyzeteket mérték fel többször, akár ugyanaz, akár más-más felmérők. A többször felmért négyzetek esetében ilyenkor az adott fajból észlelt maximum értékeket használjuk a térképek készítéséhez, ám ezt körültekintően kell elvégezni, hiszen ezek az értékek az összesítésekben is megjelennek, ott tehát ezt a problémát kezelni kell.

Ezt a következő példán mutatom be:

  • Tegyük fel, hogy az EU42D3 négyzetről két felmérőtől is kapunk adatot, az egyik felmérő 1 egerészölyvet figyelt meg ebben a négyzetben, s a többi négyzetével együtt 5 egerészölyvet jelent az adatlapon, a másik felmérő 3 egerészölyvet figyelt meg ebben a négyzetben, a többi négyzetével együtt 7 egerészölyvet jelentett az adatlapon. Ez esetben a négyzetre vonatkozó egerészölyvek száma a maximum értékek használata miatt 3 példány lesz, az összesítéseknél azonban az első felmérő megfigyelt 1 példányával csökkenteni kell a végleges országos összesítést.

A jelentés összeállítása az ellenőrzések után

Miután az ilyen átfedéseket a fent bemutatott módon kezeltük, az egyes fajok egyedszáma a felmérők által készített összesítésekből elvégezhető.

A térképek elkészítése érdekében további lépésekre van szükség. Mivel a felmérés 2,5*2,5 km-es UTM négyzeteken zajlik, az eredmények publikálása viszont 10*10 km-es UTM négyzetek alapján történik, a 2,5*2,5 km-es négyzetek maximum értékeit GIS (térinformatikai) szoftverrel összevonjuk. A térképeken bemutatásra került az, hogy egy 10*10 km-es UTM négyzetben hány 2,5*2,5 km-es négyzet felmérése történt meg, illetve, hogy azokon összesen hány példányt figyeltek meg az egyes fajokból.

Ha mindez megvan, lehet színezni, csinosítani az ábrákat és térképeket a közleményekhez, elkészíteni az összevetéseket az előző évekkel kapcsolatban, és megfogalmazni a közleményt. No meg ilyen „szobamadarász” beszámolót írni.

Bízom benne, hogy sikerült egy kis bepillantást nyerni az adatfeldolgozás rejtelmeibe és bemutatni, hogy miért is készítünk előre formázott Excel adatlapokat, szabunk szűk határidőket a beküldésre és írunk hosszadalmas kitöltési útmutatót, amelyek – valljuk be – sokszor unalmasnak tűnnek, és ezért sokan nem olvassák el. ;-)

A beszámolóban látható térképek ArcGIS szoftverrel készültek.

 

© MME-BirdLife Hungary »