Mentorált

AI Data Engineering – strukturálatlan adatoktól a vektortérig

Építs modern RAG pipeline-okat skálázható vektoradatbázisok és GraphRAG segítségével
Kamatmentes részletfizetés
Pénzvisszafizetési garancia
Tanuld meg, hogyan alakíthatod a mindenféle formátumban előforduló céges dokumentumokat az AI számára értelmezhető tudásbázissá és szolgáld ki az AI alkalmazásokat pontos kontextussal egy saját fejlesztésű, skálázható API-n keresztül!
 
Mit nyújt a képzés?
 
  • Fejlett adatbetöltés (data ingestion) és optical character recognition (OCR): Megtanulod kezelni a strukturálatlan adatokat - komplex PDF-eket, táblázatokat és szkennelt dokumentumokat dolgozol fel olyan eszközökkel, mint az Unstructured.io és a LlamaParse. Integrálod az OCR technológiákat az adatfolyamba, hogy a képi információk is kereshetővé váljanak.

  • Mérnöki szintű darabolási (chunking) stratégiák: Túllépsz a fix méretű daraboláson, és elsajátítod a szemantikus, rekurzív és sentence window stratégiákat. Megérted a mérnöki kompromisszumokat a chunk mérete és a találati pontosság között, elkerülve a kontextus vesztést.

  • Metaadat-gazdagítás és szűrés: Megtanulod, hogyan nyerj ki automatikusan metaadatokat (dátum, szerző, verzió) a nyers szövegből, és hogyan csatold ezeket a vektorokhoz. Ezzel lehetővé teszed a precíz, szűrt kereséseket (pl. "csak a 2026-os szerződések"), ami praktikus a vállalati felhasználásban.

  • Vektoradatbázisok skálázása (VectorOps): Éles környezetben (Pinecone, Weaviate) tanulsz meg dolgozni, megértve az indexelési algoritmusokat (HNSW, IVF) a milliós nagyságrendű rekordok gyors kereséséhez. Elsajátítod a vektorok karbantartását: frissítés, törlés és verziókezelés éles rendszeren.

  • Hibrid keresés és újrarangsorolás (reranking): Építesz egy pipeline-t, amely kombinálja a kulcsszavas (BM25) és a szemantikus (Dense Vector) keresést a "naiv RAG" hibáinak kiküszöbölésére. Cross-Encoder modellekkel újrarangsorolod a találatokat, jelentősen növelve ezzel a válaszok pontosságát.

  • Bevezetés a tudásgráfokba (GraphRAG): Megismerkedsz a legmodernebb trenddel, ahol a vektoros keresést gráfadatbázissal (Neo4j) ötvözöd. Képes leszel entitások közötti rejtett kapcsolatok feltárására ott, ahol a hagyományos vektoros keresés nem elég.

  • Adatelőkészítés LLM-mel: Megtanulod, hogyan építs automatizált tisztító pipeline-okat kisebb, olcsóbb modellekkel (Small Language Models). Ezekkel távolítod el a zajt (fejlécek, impresszumok) és generálsz automatikus metaadatokat (dátum, kategória, szerző) a nyers fájlokhoz, még mielőtt azok az adatbázisba kerülnének.

  • Gyakorlati záróprojekt: A képzés végén egy "Context-as-a-Service" mikro-szolgáltatást építesz, ahol a feladatod egy olyan robusztus, konténerizált backend létrehozása lesz, amely leveszi az adatfeldolgozás terhét az alkalmazásfejlesztők válláról, és szabványos API végponton keresztül szolgáltat tiszta, releváns tudást bármilyen AI alkalmazás számára (például vektor adatbázis alapú AI asszisztens alkalmazások fejlesztéséhez is.)

Miért érdemes belevágnod?
 

A vállalati adatvagyon közel 80%-a strukturálatlan formában (PDF, e-mail, kép, ppt, szöveg) hever, amivel a hagyományos SQL-alapú eszközök nem tudnak mit kezdeni, így kritikus szükség van azokra, akik ezt "Smart Data"-vá alakítják. 

Mivel az LLM modellek újratanítása (fine-tuning) rendkívül költséges, a piac a RAG (Retrieval-Augmented Generation) technológia felé mozdult el, ami az AI fejlesztés standard-je lett. 

A "naiv" vektoros keresés azonban éles környezetben gyakran elbukik, tehát hiába az egyre okosabb modellek, megfelelő "adatellátás" nélkül nehezen használhatóak vállalati környezetben. 

Ezért a cégeknek olyan szakemberekre van szükségük, akik képesek a hibrid keresés és a reranking technológiák finomhangolására a pontos válaszok érdekében. 

Az itt megszerezhető tudással építheted meg azt a "Context-as-a-Service" infrastruktúrát, ami nélkül a legokosabb nagy nyelvi modell is "vak" marad a vállalati adatokon.

Kinek ajánlott?
 

Data Engineer-eknek: Akik már magabiztosak a hagyományos ETL és SQL világában, de látják, hogy a piac a strukturálatlan adatok felé mozdul. Ők ezen a képzésen megtanulhatják, hogyan illesszék be a modern AI eszközöket (pl. Unstructured.io, Pinecone) a meglévő data pipeline-okba.

Backend és Python fejlesztőknek: Akiknek feladatuk az AI integrációja a vállalati rendszerekbe, de rájöttek, hogy egy egyszerű OpenAI API hívás nem elég a minőségi megoldáshoz. Ők itt megtanulják megépíteni azt a robusztus, konténerizált backend szolgáltatást ("Context API"), amely leveszi a terhet a frontend alkalmazásokról.

AI fejlesztőknek: Akik már értik a modellek elméletét vagy végeztek AI asszisztens alkalmazás fejlesztő kurzust, de a gyakorlatban küzdenek az adatminőség ("Garbage In, Garbage Out") problémájával. Nekik ez a képzés adja meg a tudást ahhoz, hogy ne csak "demo", hanem "production-ready" rendszereket építhessenek, ahol a keresés skálázható és pontos.

AI Solution Architect-eknek: Akiknek dönteniük kell, hogy mikor elég a vektoros keresés, és mikor szükséges gráfadatbázist (GraphRAG) bevezetni az összefüggések feltárására, és ehhez mély technikai rálátásra van szükségük.

Mik a képzés előkövetelményei?
 
  • Alapvető ismeretek az adatbázisok működéséről. 

  • Középszintű Python programozási tudás - magabiztosan kell kezelned a JSON adatokat, az API hívásokat és az objektumorientált koncepciókat.

  • Szükséged lesz egy OpenAI API kulcsra vagy hardverre helyi modellek futtatásához.

  • Mivel a képzés végén egy backend szolgáltatást építesz, előnyt jelent, ha nem idegen számodra a Docker és a REST API-k.

A "hagyományos" Data Engineer végzettség egyértelmű előny, de nem kötelező feltétel, mindent a gyakorlatban, a "nulláról" építünk fel.

Hogyan fogsz tanulni?
 
Komplex feladat ikon
Komplex gyakorlatorientált feladatok: A feladatok során olyan komplex feladatokat oldhatsz meg, mint virtuális gépek létrehozása, applikációk dockerizálása és hosztolása. A képzés átfogó utolsó feladatában pedig egy teljes infrastruktúrát is ki kell alakítanod.
Interaktív tananyag ikon
Interaktív digitális tananyag: A gyakorlati feladatok elvégzéséhez és a tanfolyam sikeres teljesítéséhez szükséges tudást digitális oktatóvideók és további tananyagok, valamint vezetett kódolások formájában adjuk át.
Rugalmas idő ikon
Rugalmas időbeosztás: A tanfolyamot munka mellett is végezheted, hiszen a tananyag elsajátítása heti 8-12 óra elfoglaltságot igényel összesen, melyet saját időbeosztás szerint dolgozhatsz fel.
Oktatói mentoring ikon
Oktatói mentoring: A képzés ideje alatt az oktató folyamatosan a rendelkezésedre áll, bármikor kérdezhetsz tőle, ha elakadtál, és rendszeresen visszajelzést ad a feladataidra, fejlődésedet végigkíséri.
Konzultáció ikon
Konzultációk: Valamennyi tanegység végén egy-egy élő konzultációs alkalmat is szervezünk este 18:00 órától, amikor élőben is felteheted kérdéseidet, közösen kiértékelhetitek és átbeszélhetitek a gyakorlás során elkészített projekteket, és tanulhattok egymás elakadásaiból is.
Limitált férőhely ikon
Limitált férőhely: A fent említett interakciók miatt képzéseinket korlátozott létszámmal indítjuk csak el, hogy biztosan jusson mindenkire ideje az oktatóknak.
Mikor indul a képzés és mennyibe kerül?
 

Képzés indulásának időpontja: Jelenleg nincs meghirdetett időpontunk, de hamarosan érkezik! ​Addig is kötelezettségek nélkül előjelentkezhetsz és emailben értesítünk, amint felkerül a következő elérhető tanfolyam időpontja.​

Részvételi díj: 290.000 Ft

Mit érdemes tudnod a fizetésről?
 
Pénzvisszafizetési garancia:  Biztosak vagyunk a képzés tartalmát és minőségét illetően, ezért a képzés indulásától 8 napig 100%-os pénzvisszafizetési garanciát vállalunk.
Kamatmentes részletfizetés:  Nem szeretnénk, ha fizetési nehézségek akadályoznák a szakmai fejlődésedet, ezért a részvételi díjat akár több részletben is fizetheted, teljesen kamatmentesen.
Céges számla igénylése:  Erre is van lehetőség, ha a "Beiratkozom" gombra kattintás után elérhető jelentkezési űrlapon kipipálod az “Áfás számla igénylés”-t.
Utalásos fizetés:  Amennyiben az online kártyás fizetés helyett utalással szeretnél fizetni, csak válaszd ezt az opciót a tanfolyam jelentkezési űrlapjánál a "Beiratkozom" gombra kattintás után.
Ha érdekel a képzés két lehetőséged van
 
1

Jelentkezel a képzésre: Ha eldöntötted, hogy jelentkezel a képzésre és szeretnéd biztosítani helyedet, nincs más teendőd, mint a „Beiratkozom” gombra kattintva kitölteni a jelentkezési formot és kifizetni a képzés díját.

2

Kérdezel még a képzésről: Ha szívesen jelentkeznél, de úgy érzed még van néhány kérdés, amire nem találtad meg a választ, kattints az „Érdekel, de kérdeznék” gombra, add meg elérhetőségedet és 48 órán belül felvesszük veled a kapcsolatot, vagy írj nekünk közvetlenül az info@cubixedu.com e-mail címre!

Hasonló képzések a témában

Aszinkron
Adattechnológia
~5 óra
29 000 Ft
Aszinkron
Mesterséges Intelligencia
~3 óra
29 000 Ft
Aszinkron
Mesterséges Intelligencia
~5 óra
19 000 Ft
Mentorált
IT menedzsment
8 hét
2025-12-08
190 000 Ft