Interjú Pálvölgyi Patrikkal Data Science képzésünkről
Pálvölgyi Patrik izgalmas és érdekes, gyakran változó területről érkezett két féléves Data Science képzésünkre. Az ingatlanüzemeltetéssel foglalkozó a Westend Üzemeltető Kft-nél dolgozik üzleti elemzőként, és a képzést megelőzően már régóta adatokkal dolgozott. Patrik mindenképpen olyan témát akart választani a projektmunkájához, melynek valódi haszna és üzleti értéke van a projekt és a képzés elvégzése után is. Végül a bevásárlóközpont bérlői forgalmának előrejelzése lett a téma, és Patrik elmondása szerint könnyen és hatékonyan zajlott a csapatmunka.
Milyen elvárásokkal érkeztél a képzésre, mit vártál a képzéstől?
Az ingatlanüzemeltetésben, mint ahogy szinte bármely más szektorban is, felértékelődött az üzleti értékkel bíró adatok elemzése, melyből az következik, hogy ez a piac is adatvezérelt működési alapon tud kiemelkedően sikeres lenni. Nagy mennyiségű bérlői és látogatói adatokat gyűjtünk nap mint nap, és ezek elemzésével tudjuk azt megmondani, hogy mik a jelenlegi vásárlói és bérlői igények, trendek, merrefele halad a piac.
A képzéstől azt vártam, hogy új elemzési eszközökkel, kicsit másfajta szemléletmóddal tudom majd az adatokat vizsgálni, és ez a végén igazolódott is. Azt az elején fontos tisztázni, hogy ez nem programozó képzés, hanem inkább ahogy Nagy-Rácz István képzésvezető is említette már az első alkalommal, „hídember” szerepet ad, tehát a menedzsment és a programozók közötti űrt képes betölteni. Ezt persze kellő elszántsággal tovább is lehet vinni és a modelling részt is haladóbb szintre lehet fejleszteni.
Minek a hatására döntötted el, hogy szeretnél mélyebben is megismerkedni az adatos területtel? Milyen szinten foglalkoztál adatokkal a képzés elvégzése előtt?
Üzleti elemzőként eddig is mélyebb szinten foglalkoztam az adatokkal, az Excel, Power BI és az ERP rendszerünk segítségével megfelelő minőségű riportokat tudtunk előállítani a menedzsmentnek, azonban az Excel egy pont után már nem elegendő nagy mennyiségű adat feldolgozására. Szerettem volna olyan programokat, eszközöket megismerni, amelyek erre a célra alkalmasak. A Pythont és a Rapidminert használtuk a legtöbbször adatelemzésre az órákon, ezzel gyakorlatilag alkalmaztunk high code (Python) és low code (Rapidminer) eszközt is, így széleskörűen bemutatták, hogy a nagy mennyiségű adatokat hogyan célszerű elemezni. Hozzám a Python közelebb került, annak ellenére, hogy még sosem programoztam előtte. Úgy volt felépítve a képzés, hogy az alapoktól indultunk, így gyakorlással fel lehetett venni a ritmust.
Hol hallottál a képzésről?
Véletlenül futottam bele ebbe a képzésbe, adatelemzéssel foglalkozó tréningeket kerestem és 2-3 ilyen irányú tanfolyamot hasonlítottam össze. Az érthetően és széleskörűen felépített tematika és értékelések alapján esett a választásom a KÜRT Akadémiára. Jól döntöttem.
A tanultak közül mely módszerek, vagy a képzés mely témái voltak leginkább tanulságosak/hasznosak számodra?
Pár héttel a képzés vége után átgondolva ezt a kérdést, azt tudom mondani, hogy mindegyik téma nagyon érdekes és hasznos volt. A tematika tényleg nagyon jól volt felépítve, mi már a XII. évfolyam voltunk, profin összeállt a „tananyag”, illetve az órát adó szakemberek is nagyon hitelesek voltak, sok-sok éve ebben a szakmában dolgoznak és az órákat is úgy tették össze, hogy a gyakorlatra helyezték általában a hangsúlyt.
Ami a legérdekesebb volt számomra és nem is nagyon hittem el az elején, hogy a data understanding és a data preparation lépések közel 60-70%-át teszik ki egy-egy data science projektnek, a modellezés pedig egy jóval kisebb részt képvisel a teljes folyamatban. A projektfeladatunk alatt azonban ezt tényleg érzékeltük, nekem nagyon fontos tanulság volt, hogy ne becsüljük le az adatok megértését és előkészítését, fontos, hogy az adatokat már a projektek legelején strukturált és megfelelő formátumban gyűjtsük, mert ez nagyban hozzá fog járulni az adatelemzés sikerességéhez.
A képzésen több csapatban dolgoztatok projektfeladatokon. Mesélnél a projektről, és arról, hogy mi is volt pontosan a célotok, milyen adatokkal dolgoztatok, milyen módszereket használtatok?
Olyan témát akartunk választani, aminek üzleti értéke is lesz a projektmunka után, ezzel mindenki egyetértett a csoportban. Bevásárlóközpont bérlői forgalmának előrejelzését választottuk ki végül a témák közül, melyhez tudtunk hashelt (az adatok szenzitív volta miatt manipulált, kerekített adatok az arányok megtartásával) adatokat szerezni. Szerencsére olyan csoporttársaim lettek, akikkel nagyon könnyen ment a közös munka, kéthetente tartottunk meetingeket, ahol mindig megbeszéltük, hogy hol tartunk jelenleg és hogyan menjünk tovább, szétosztottuk a feladatokat.
Többféle regressziós modellt is kipróbáltunk, végül a Gradient Boosting Regressort alkalmaztuk a modellünknél. Jó pár hibát elkövettünk, azonban pontosan tudtuk, hogy ezekből tudunk tanulni. Ha nem jöttek volna elő ezek a problémák, akkor az nagyon gyanús lett volna. Nagy-Rácz Istvánnal hetente volt lehetőség konzultálni, ahol a megfelelő irányba próbált minket terelni egy-egy rossz lépésnél. Végül sikerült egy működőképes modellt elkészítenünk, amit éles környezetben is lefuttattam és nagyon jó eredményeket kaptunk. A vizsgaprezentáción elhangzott egy másféle neurális hálós modell az egyik értékelő oktatótól, amit megpróbálok majd a közeljövőben beépíteni a modellbe, hogy még pontosabb legyen.
Kiknek ajánlanád a képzést?
Olyan szakembereknek ajánlanám, akik valamilyen szinten már dolgoztak adatokkal és szeretnék mélyíteni a tudásukat. Ettől függetlenül olyan emberek is részt vettek a tréningen, akik nem ilyen munkakörökben dolgoztak és velük beszélgetve is azt a következtetést tudtam levonni, hogy bár a technikai részt nehezebben tudták elsajátítani, de ugyanazt gondolják az adatok jelentőségéről. Ezen felül mindannyian az adatvezérelt működésben látják a jelent és a jövőt, nekik is praktikus volt részt venni az órákon.
Ha érdekel a Data Science képzésünk, ismerd meg részletes tematikánkat!
Hozzászólások