Geoinformatikai első helyezés az OTDK-n

Vizes élőhelyek térképezése radarral

Az április 23-26. között megrendezett Országos Tudományos Diákköri Konferencia fizika, földtudományok és matematika szekciójában első helyezést ért el a Lechner Tudásközpont távérzékelési osztályának munkatársa, Pacskó Vivien. Dolgozatában radar távérzékelésből származó adatokkal előállított élőhely-térkép pontosságát, valamint a vizes osztályok szempontjából leghasznosabb radar mennyiségeket vizsgálta.

34. alkalommal rendezték meg az Országos Tudományos Diákköri Konferenciát, melynek fizika, földtudományok és matematika szekciójának idén az Eszterházy Károly Egyetem szervezésében Eger adott otthon. Az április 23-26. között megrendezett versenyen Pacskó Vivien, a Lechner Tudásközpont távérzékelési osztályának munkatársa első helyezést ért el Geoinformatika tagozatban.

Vivien az Eötvös Loránd Tudományegyetem űrkutató-távérzékelő szakirányos hallgatójaként a "Radar távérzékelésből származó időbeli integrálok vizsgálata vizes élőhelyek térképezése céljából" című dolgozatában Sentinel-1 SAR felvételek idősora alapján végzett véletlen erdő tanított osztályozásokat egy vizes élőhelyekben gazdag kiskunsági mintaterületen.

A véletlen erdő (Random Forest) egy úgynevezett együttes (ensemble) vagy kombinált osztályozó (classifier combination) módszer. Egy együttes módszer alaposztályozók — jelen esetben döntési fák — halmazát hozza létre, majd úgy végez osztályozást, hogy többségi szavazást tart az egyes osztályozó elemek között [Breiman, 2001]. Az osztályozó felépítésében fontos az egyes alaposztályozók bemeneti jellemzőinek megválasztása, ami történhet automatikusan, vagy szakterületi szakértők ajánlása alapján. A véletlen erdő erőssége általánosságban, hogy egymástól eltérő jellegű, és skálájú adatokat is hatékonyan kezel együtt, nem érzékeny a tanulóadatok eloszlására, valamint kisebb torzításokat, zajokat is tolerál. Mint a legtöbb osztályozó algoritmus, a véletlen erdő is érzékeny azonban referenciaadatok minőségére, így az eredmények pontossága nem haladhatja meg a bemenő adat pontosságát. Maga az algoritmus több nyílt forráskódú környezetben, például R-ben és Pythonban is implementálva van, így a paraméterek megválasztása után automatizálható módon is futtatható. Ebben az esetben a scikit-learn Python csomag került felhasználásra [Pedregosa et al., 2011].
Breiman, 2001: Breiman, L., (2001) Random Forests, Machine Learning, 45(1), 5-32. Pedregosa et al., 2011: Pedregosa, F., Varoquaux, G., Gramfort, A.,Michel, V., Thirion, B., Grisel, O., Blondel, M., Prettenhofer, P., Weiss, R., Dubourg, V., Vanderplas, J., Passos, A., Cournapeau, D., Brucher, M., Perrot, M. and Duchesnay, E. (2011) Scikit-learn: Machine Learning in Python, Journal of Machine Learning Research, 12(Oct), 2825-2830.

Kutatásában vizsgálta, hogy pusztán radar távérzékelésből származó adatokkal milyen pontosságú élőhely-térkép állítható elő, valamint hogy a vizes osztályok szempontjából melyek a leghasznosabb radar mennyiségek, időpontok és időintervallumok. Ezenfelül az osztályonkénti pontosságok alapján megállapításokat tett az egyes vízzel érintett kategóriák osztályozhatóságára, egymással való keveredéseire is. Célul tűzte ki, hogy minden feldolgozási és elemzési lépés automatizálható legyen, így módszertana később az országos operatív térképezési feladatokba is beépülhet. Vivien pályamunkáját egyetemi témavezetője, Dr. Molnár Gábor, valamint Dr. Petrik Ottó, a Lechner Tudásközpont távérzékelési szakértő szakmai vezetésével készítette el.

Gratulálunk Viviennek az első helyezéshez!

Az OTDK-ról bővebb információ itt érhető el.

Fenyővári Bernadett