650 Euro/ persoană + TVA
2 zile
Intermediar
650 Euro/ persoană + TVA
2 zile
Cursul oferă o introducere cuprinzătoare în utilizarea Python și Apache Spark pentru procesarea și analiza eficientă a datelor de mari dimensiuni. Acesta acoperă aspecte esențiale precum arhitectura Spark, ciclul de viață, API-ul, RDD, DataFrames, Datasets și executarea aplicațiilor. Participanții vor înțelege anatomia și execuția unei aplicații Spark, sistemul de stocare distribuit, relația dintre Spark și Hadoop, rolul lor în analiza de date în timp real, gestionarea clusterelor și operațiile paralele. Cursul dezvoltă competențe practice în utilizarea PySpark pentru soluții de analiză de date scalabile.
Cursul se adresează studenților și absolvenților în informatică, inginerie software, matematică sau domenii conexe, profesioniștilor IT, analiștilor de date, inginerilor software și administratorilor de baze de date interesați să învețe programarea PySpark și să aprofundeze conceptele legate de Apache Spark și Hadoop. Acest curs este potrivit și pentru manageri, decidenți și consultanți care doresc să înțeleagă rolul Spark și Hadoop în analiza de date analitice în timp real și să optimizeze performanța sistemelor lor. Cursul se adresează, de asemenea, cercetătorilor și academicienilor interesați să utilizeze PySpark în proiectele de cercetare, precum și antreprenorilor și start-up-urilor care doresc să integreze tehnologiile Spark și Hadoop în soluțiile lor.