> Python: megtanulod a Python nyelv alapjait.
> Pandas: megismered a Pandas könyvtár használatát adathalmazok tisztítására, átalakítására és elemzésére.
> Anaconda & Jupyter Notebook: bemutatjuk az Anaconda Distribution (Anaconda Navigator) felhasználói felület használatát, és azon belül a Jupyter Notebook felhasználóbarát programozási környezetét.
> Automatizált ETL folyamatok építése AWS-ben: elsajátítod, hogyan migráld a lokális Python kódokat cloud-ba, a különböző formátumú adatok tárolását S3 bucket-ekben, majd ezek automatizált feldolgozását Lambda function-ökkel.
> Adatlekérdezés és vizualizáció: a feldolgozott adatokat az AWS Glue és Athena szolgáltatásokkal teszed lekérdezhetővé, majd vizualizálod az eredményeket a folyamat sikerességének értelmezéséhez.
> SQL alapok: mindeközben megtanulod az SQL lekérdezések alapjait, az egyszerű adatszűrésektől és aggregációktól kezdve a komplexebb tábla-összekapcsolásokig.
> Adatgyűjtés a web-ről: bemutatjuk a web scrapinget, ami segítségével információkat nyerhetsz ki weboldalakról, melyeket beépíthetsz majd az adatmodelledbe.
> Hatékony adatfeldolgozási pipeline-ok építése és kezelése: elsajátítod, hogyan tervezz és valósíts meg hatékony adatfeldolgozási pipeline-okat, amelyek biztosítják az adatok folyamatos és megbízható áramlását és feldolgozását.
> Microsoft Azure cloud szolgáltatások használata: megismerkedsz az Azure különböző szolgáltatásaival, mint például a Synapse és Databricks. Kiemelt hangsúlyt kap az adattárolás, adattranszformációk és ütemezés optimalizálása.
> Apache Spark és PySpark használata: átfogó képet kapsz az Apache Spark és a PySpark alapjairól, beleértve a DataFrame-ek kezelését, elosztott rendszerek működését, és a Spark optimalizálási technikáit (shuffling, bucketing, partitioning).
> Data modeling legjobb gyakorlatai: elsajátítod a data modeling alapjait, elmélyedsz különböző adat architektúrákban (Data Warehouse, Data Lake, Data Mart), valamint az OLTP és OLAP rendszerek közötti különbségeket is megismered. Külön figyelmet kapnak a starschema és snowflake modellek, valamint a Kimball, Inmon és OBT trendek.
> SQL haladó technikák: haladóbb lekérdezési technikákat is megtanulsz majd, melyek segítenek az adatok hatékony lekérdezésében és kezelésében.
> Gyakorlati tapasztalat projektmunkán keresztül: résztvevőként több projekt keretében valós adatfeldolgozási feladatokat kell majd megoldanod, így biztosítva a gyakorlati tapasztalat megszerzését és a tanultak elmélyítését. Ez a projektmunka természetesen referenciaként is szolgálhat majd a portfóliódban.