Podcasterek. Sikeresek. Karakterek. Kifejezetten viccesek. Hisznek az adatok erejében. Van, amiben egyetértenek, és van, amit nagyon máshogy látnak. Az est legfőbb különlegessége az volt, hogy most először ültek le együtt megvitatni a Data Science múltját, jelenét és jövőjét egy élő podcast keretében.
Rejtett összefüggések, két legendás cikk a Harvard Business Review-ból, a híres 2008-as Netflix verseny, DE (Data Engineer), ML (Machine Learning), BI (Business Intelligence), és minden, ami fontos a legszexibb(nek titulált) szakmáról.
A meetup házigazdája Nagy-Rácz István, a Dmlab alapítója és senior partnere és a KÜRT Akadémia Data Science képzésének vezetője, meghívott vendégei pedig Biczó Zoltán senior data scientist, az Adatépítész podcastere, Kovács Gyula független adatkommunikációs szakértő és Data Science coach, Körmendi György fizikus, adattudós, a Clementine ügyvezetője, ketten a Láncreakció podcast házigazdái, és Mester Tomi, adatos szakember, a Data36 nevű cég vezetője, a Biznisz Boyz podcastere.
Az est dinamikáját provokatív kérdések és frappáns válaszok formálták - kis túlzással, de David Letterman elkezdhet aggódni.
A cikk, ami átpozicionálta az adatelemzőket, és elültette a bogarat
Thomas H. Davenport és DJ Patil szerzőpárosnak egy, a Harvard Business Review-ban megjelent 2012-es cikkével, a “Data Scientist: The Sexiest Job of the 21st Century” című anyagával indult a beszélgetés, és Nagy-Rácz István legelső kérdése arra vonatkozott, a vendégek közül kire volt hatással a cikk, és vajon befolyásolta-e az írás azt, ahogyan ki-ki a saját szakmájáról gondolkodik. Röviden: a cikk azt fejti ki, hogy a Data Scientist válik a 21. század legszexibb foglalkozásává, mégpedig azért, mert felbecsülhetetlenül nagy szerepe lesz azoknak, akik képesek az adatok nyelvét az üzleti döntések nyelvére lefordítani. “The Hot Job of the Decade” - így definiálták a Data Scientist kifejezést, melyről az est folyamán később elhangzott, hogy csupán marketingfogás, mellyel az addig használt adatbányászat kifejezést cserélték le - szerintük - izgalmasabbra.
Kovács Gyula például így élte meg: „Ha egyetlen szóval kellene összefoglalnom, mi az, ami eszembe jut a cikkről, az a lelkesedés. Akkor kezdett ez a szó elterjedni, előtte máshogy neveztük az adatelemzést. Egy olyan pillanatát fogta meg a Data Science-nek az írás, ami talán ahhoz fogható, mint amikor leomlott a berlini fal, és mindenki úgy hitte, hogy egy új világ kezdődik.”
Az adatok világába mindenki máshogy és máshonnan érkezett: építészeti tanulmányok, ELTE fizikus képzés, Közgáz, programozó matematikus karrier – az út sokféle lehet, valahogy mégis összefügg a felfedezés és a flow élményével.
Kedvenc projektek
Nagy-Rácz István ezután kedvenc projektekre kérdezett rá. Biczó Zoltán kedvenc projektje egy streaming szolgáltató 1 évvel korábbi, fogyasztói szokásokra vonatkozó feladata volt - további pikáns részletek is kiderülnek a videóból. Körmendi György cége, a Clementine aktuális projektjét nevezte meg, mely összetett rendszerekkel dolgozik és virtuális asszisztenst fejleszt. Mester Tomi mindig az utolsó projektjét szereti legjobban: a legutóbbi whisky kereskedők megtérüléseivel kapcsolatos adatelemzésről szólt. Kovács Gyula egy 2 évvel ezelőtti adatelemző versenyt nevezett meg, melyre benevezett, és 3. helyezést ért el számára viszonylag idegen területen.
Ami közös: podcast műfaj
Az adatok mellett a podcast az, ami összeköti a 4 meghívott vendéget. Mester Tomi Biznisz Boyz címmel vállalkozói podcastot indított el 4,5 éve két barátjával, kéthetente készülnek újabb epizódok. Néha kitér benne a Data Science-re is, de nem ez a fő terület. Szívesen hallgatja kollégái adásait, gyakran hívnak vendégeket is. Biczó Zoltán kezdetben amerikai podcastokat hallgatott, melyek sok szakmai segítséget nyújtottak neki. Magyar podcast híján kezdte el küldetéstudatból, 3 teljes éven át anonim módon saját, Adatépítész című podcastját, hogy szakmabelieknek adjon segítséget. Több, mint 6 éve megy a podcast, és 200 felett van az epizódok száma. A Láncreakciót megelőzően Körmendi György és Kovács Gyula eredetileg blogot szeretett volna indítani, ami végül podcast formájában öltött testet. Podcastjukkal kifejezett céljuk volt a felelős szakmai véleményformálás, a többféle nézőpont ütköztetése, valamint szakmai aktualitások és trendek mellett a gépi tanulásnak a világra gyakorolt hatását is bemutatni.
De mi is a Data Science pontosan?
Szóba került a Data Science terület definiálása is, melyhez Nagy-Rácz István a 2012-es Business Harvard Review cikke után a szerzőknek egy 10 évvel későbbi, azaz idei, 2022-es cikkét hozta be a beszélgetésbe. 10 év sok idő, a cikk arra keresi a választ, vajon még mindig valid-e a Data Science-re kikiáltott “legszexibb szakma” kifejezés? Kovács Gyula fejtette ki válaszában, hogy szó szerinti értelmében a Data Science terület már nem is létezik. Vannak részterületek: BI (Business Intelligence), DE (Data Engineering), ML (Machine Learning), melyek mindegyike érdekes, de nem a szó szoros értelmében vett Data Science-t jelentik.
“Az a baj a Data Science kifejezéssel, hogy ha megkérdezel 10 különböző embert, aki a Linkedin-en Data Scientist-ként van fent, hogy mi is ez pontosan – akkor 10 teljesen különböző választ fogsz kapni. De ugyanez igaz a Data Science álláshirdetésekre is” - fejtette ki Mester Tomi.
Körmendi György itt jegyezte meg, hogy nincs több ennyire önreflektív szakma, mint a Data Science, ami ennyire sokat foglalkozna a saját definiálásával.
Ki mennyire komfortos az Auto ML-lel?
Egy másik trend, az Auto ML (Automatizált gépi tanulás) ígérete is felmerült a beszélgetés során. Az Auto ML lehet az az eszköz, ami újabb nagy fordulatot és ezzel gyökeres változást hozhat a Data Science életében. Végezhetik-e robotok Data Scientist-ek munkáját? Kiválthatják-e az emberi munkát, vagy annak egy részét? Féljünk vagy örüljünk? A szakértők szerint bizonyos részfeladatokat gond nélkül elláthatnának a robotok is, leginkább azokat, melyek egy senior Data Scientist számára már unalmas és kihívás nélküli feladatok. Van, aki már megtalálta a munkájában azokat a részeket, melyek elvégzéséhez bevetheti az Auto ML-t.
“Mind tudományos, mind üzleti értelemben is használom. Az én folyamataimban abszolút látom és megtaláltam az Auto ML helyét. Nem féltem magam az Auto ML-től. Az esetek döntő többségében én nem elemzést, hanem adatterméket csinálok, és ez a folyamat sok prototipizálást igényel. Egyelőre jobb vagyok, mint a gép, de itt fontosabb a gyorsaság, hogy minél rövidebb idő alatt minél több ötletet el tudjak indítani egy ügyfél számára. Az én szememben állati jó eszköz arra, hogy az időigényes részfeladatokat megcsinálja helyettünk” - mondta Biczó Zoltán.
Mi vár a szakmára? Mi fog változni és mi fog történni a következő 10 évben?
“A legérdekesebb szerintem az, hogy az életünkben milyen mértékben jelenik majd meg az új technológia és a gépi tanulás, és mindez mennyire észrevétlenül történik meg, szinte beleszövődik a mindennapjainkba. Jó példa erre a rengeteg, angolról magyarra fordított hír, amit már fordítóprogramok fordítanak, az esetek többségében már egyre jobb minőségben. Gyorsabb, hatékonyabb, rengeteg időt és energiát spórolhatnak nekünk, de felveti a kérdést, hogy ez bizony óhatatlanul nyelvromláshoz vezethet. Tehát hasznos az eszköz, de a tudatosság még inkább az” - fogalmazta meg Körmendi György.
Az utolsó kérdés arra vonatkozott, ki miért szereti a Data Science területet? A válaszok pedig - “forrongó, forradalmi, turbulens terület, az egyik leggyorsabban változó terület, nagyon izgalmas”, “a felfedezés és az alkotás öröme”, - egyöntetűen azt mutatják, hogy ez a misztikus, olykor definiálásra szoruló, akarjuk vagy sem, de szexinek hangzó, rohamos iramban fejlődő terület továbbra is vonzó és igazi kincskeresést ígérő szakma.
Ha neked is a lelkesedés az első szó, ami eszedbe jut az olvasottak alapján, akkor a KÜRT Akadémia Data Science képzésén a helyed, ahol adatok nyelvét beszélő specialistává válsz.
Hozzászólások