Barion Pixel

Data Science meetup: Csillagos ötös

2022 november 4.

Podcasterek. Sikeresek. Karakterek. Kifejezetten viccesek. Hisznek az adatok erejében. Van, amiben egyetértenek, és van, amit nagyon máshogy látnak. Az est legfőbb különlegessége az volt, hogy most először ültek le együtt megvitatni a Data Science múltját, jelenét és jövőjét egy élő podcast keretében.

Rejtett összefüggések, két legendás cikk a Harvard Business Review-ból, a híres 2008-as Netflix verseny, DE (Data Engineer), ML (Machine Learning), BI (Business Intelligence), és minden, ami fontos a legszexibb(nek titulált) szakmáról.

A meetup házigazdája Nagy-Rácz István, a Dmlab alapítója és senior partnere és a KÜRT Akadémia Data Science képzésének vezetője, meghívott vendégei pedig Biczó Zoltán senior data scientist, az Adatépítész podcastere, Kovács Gyula független adatkommunikációs szakértő és Data Science coach, Körmendi György fizikus, adattudós, a Clementine ügyvezetője, ketten a Láncreakció podcast házigazdái, és Mester Tomi, adatos szakember, a Data36 nevű cég vezetője, a Biznisz Boyz podcastere. 

Az est dinamikáját provokatív kérdések és frappáns válaszok formálták - kis túlzással, de David Letterman elkezdhet aggódni.

A cikk, ami átpozicionálta az adatelemzőket, és elültette a bogarat

Thomas H. Davenport és DJ Patil szerzőpárosnak egy, a Harvard Business Review-ban megjelent 2012-es cikkével, a “Data Scientist: The Sexiest Job of the 21st Century” című anyagával indult a beszélgetés, és Nagy-Rácz István legelső kérdése arra vonatkozott, a vendégek közül kire volt hatással a cikk, és vajon befolyásolta-e az írás azt, ahogyan ki-ki a saját szakmájáról gondolkodik. Röviden: a cikk azt fejti ki, hogy a Data Scientist válik a 21. század legszexibb foglalkozásává, mégpedig azért, mert felbecsülhetetlenül nagy szerepe lesz azoknak, akik képesek az adatok nyelvét az üzleti döntések nyelvére lefordítani. “The Hot Job of the Decade” - így definiálták a Data Scientist kifejezést, melyről az est folyamán később elhangzott, hogy csupán marketingfogás, mellyel az addig használt adatbányászat kifejezést cserélték le - szerintük - izgalmasabbra. 

Kovács Gyula például így élte meg: „Ha egyetlen szóval kellene összefoglalnom, mi az, ami eszembe jut a cikkről, az a lelkesedés. Akkor kezdett ez a szó elterjedni, előtte máshogy neveztük az adatelemzést. Egy olyan pillanatát fogta meg a Data Science-nek az írás, ami talán ahhoz fogható, mint amikor leomlott a berlini fal, és mindenki úgy hitte, hogy egy új világ kezdődik.”

Az adatok világába mindenki máshogy és máshonnan érkezett: építészeti tanulmányok, ELTE fizikus képzés, Közgáz, programozó matematikus karrier – az út sokféle lehet, valahogy mégis összefügg a felfedezés és a flow élményével. 

Kedvenc projektek

Nagy-Rácz István ezután kedvenc projektekre kérdezett rá. Biczó Zoltán kedvenc projektje egy streaming szolgáltató 1 évvel korábbi, fogyasztói szokásokra vonatkozó feladata volt - további pikáns részletek is kiderülnek a videóból. Körmendi György cége, a Clementine aktuális projektjét nevezte meg, mely összetett rendszerekkel dolgozik és virtuális asszisztenst fejleszt. Mester Tomi mindig az utolsó projektjét szereti legjobban: a legutóbbi whisky kereskedők megtérüléseivel kapcsolatos adatelemzésről szólt. Kovács Gyula egy 2 évvel ezelőtti adatelemző versenyt nevezett meg, melyre benevezett, és 3. helyezést ért el számára viszonylag idegen területen.

Ami közös: podcast műfaj

Az adatok mellett a podcast az, ami összeköti a 4 meghívott vendéget. Mester Tomi Biznisz Boyz címmel vállalkozói podcastot indított el 4,5 éve két barátjával, kéthetente készülnek újabb epizódok. Néha kitér benne a Data Science-re is, de nem ez a fő terület. Szívesen hallgatja kollégái adásait, gyakran hívnak vendégeket is. Biczó Zoltán kezdetben amerikai podcastokat hallgatott, melyek sok szakmai segítséget nyújtottak neki. Magyar podcast híján kezdte el küldetéstudatból, 3 teljes éven át anonim módon saját, Adatépítész című podcastját, hogy szakmabelieknek adjon segítséget. Több, mint 6 éve megy a podcast, és 200 felett van az epizódok száma. A Láncreakciót megelőzően Körmendi György és Kovács Gyula eredetileg blogot szeretett volna indítani, ami végül podcast formájában öltött testet. Podcastjukkal kifejezett céljuk volt a felelős szakmai véleményformálás, a többféle nézőpont ütköztetése, valamint szakmai aktualitások és trendek mellett a gépi tanulásnak a világra gyakorolt hatását is bemutatni.

De mi is a Data Science pontosan?

Szóba került a Data Science terület definiálása is, melyhez Nagy-Rácz István a 2012-es Business Harvard Review cikke után a szerzőknek egy 10 évvel későbbi, azaz idei, 2022-es cikkét hozta be a beszélgetésbe. 10 év sok idő, a cikk arra keresi a választ, vajon még mindig valid-e a Data Science-re kikiáltott “legszexibb szakma” kifejezés? Kovács Gyula fejtette ki válaszában, hogy szó szerinti értelmében a Data Science terület már nem is létezik. Vannak részterületek: BI (Business Intelligence), DE (Data Engineering), ML (Machine Learning), melyek mindegyike érdekes, de nem a szó szoros értelmében vett Data Science-t jelentik.

“Az a baj a Data Science kifejezéssel, hogy ha megkérdezel 10 különböző embert, aki a Linkedin-en Data Scientist-ként van fent, hogy mi is ez pontosan – akkor 10 teljesen különböző választ fogsz kapni. De ugyanez igaz a Data Science álláshirdetésekre is” - fejtette ki Mester Tomi. 

Körmendi György itt jegyezte meg, hogy nincs több ennyire önreflektív szakma, mint a Data Science, ami ennyire sokat foglalkozna a saját definiálásával. 

Ki mennyire komfortos az Auto ML-lel? 

Egy másik trend, az Auto ML (Automatizált gépi tanulás) ígérete is felmerült a beszélgetés során. Az Auto ML lehet az az eszköz, ami újabb nagy fordulatot és ezzel gyökeres változást hozhat a Data Science életében. Végezhetik-e robotok Data Scientist-ek munkáját? Kiválthatják-e az emberi munkát, vagy annak egy részét? Féljünk vagy örüljünk? A szakértők szerint bizonyos részfeladatokat gond nélkül elláthatnának a robotok is, leginkább azokat, melyek egy senior Data Scientist számára már unalmas és kihívás nélküli feladatok. Van, aki már megtalálta a munkájában azokat a részeket, melyek elvégzéséhez bevetheti az Auto ML-t. 

“Mind tudományos, mind üzleti értelemben is használom. Az én folyamataimban abszolút látom és megtaláltam az Auto ML helyét. Nem féltem magam az Auto ML-től. Az esetek döntő többségében én nem elemzést, hanem adatterméket csinálok, és ez a folyamat sok prototipizálást igényel. Egyelőre jobb vagyok, mint a gép, de itt fontosabb a gyorsaság, hogy minél rövidebb idő alatt minél több ötletet el tudjak indítani egy ügyfél számára. Az én szememben állati jó eszköz arra, hogy az időigényes részfeladatokat megcsinálja helyettünk” - mondta Biczó Zoltán. 

Mi vár a szakmára? Mi fog változni és mi fog történni a következő 10 évben? 

“A legérdekesebb szerintem az, hogy az életünkben milyen mértékben jelenik majd meg az új technológia és a gépi tanulás, és mindez mennyire észrevétlenül történik meg, szinte beleszövődik a mindennapjainkba. Jó példa erre a rengeteg, angolról magyarra fordított hír, amit már fordítóprogramok fordítanak, az esetek többségében már egyre jobb minőségben. Gyorsabb, hatékonyabb, rengeteg időt és energiát spórolhatnak nekünk, de felveti a kérdést, hogy ez bizony óhatatlanul nyelvromláshoz vezethet. Tehát hasznos az eszköz, de a tudatosság még inkább az” - fogalmazta meg Körmendi György. 

Az utolsó kérdés arra vonatkozott, ki miért szereti a Data Science területet? A válaszok pedig - “forrongó, forradalmi, turbulens terület, az egyik leggyorsabban változó terület, nagyon izgalmas”, “a felfedezés és az alkotás öröme”, - egyöntetűen azt mutatják, hogy ez a misztikus, olykor definiálásra szoruló, akarjuk vagy sem, de szexinek hangzó, rohamos iramban fejlődő terület továbbra is vonzó és igazi kincskeresést ígérő szakma. 

Data Science meetup-unk házigazdája és meghívott vendégei, balról jobbra: Mester Tomi, Biczó Zoltán, Nagy-Rácz István, Körmendi György, Kovács Gyula

Ha neked is a lelkesedés az első szó, ami eszedbe jut az olvasottak alapján, akkor a KÜRT Akadémia Data Science képzésén a helyed, ahol adatok nyelvét beszélő specialistává válsz.

Érdekel a Data Science képzés

2022 november 4.

Hozzászólások