* Crea dati di dati: Lo scopo principale era quello di creare frame di dati da varie fonti di dati (come file CSV, file JSON, tabelle Hive, ecc.). I frame dati sono raccolte strutturate di dati organizzati in colonne denominate.
* Esegui query SQL: È possibile eseguire query SQL direttamente contro i dati di dati registrati come tabelle temporanee o persistenti all'interno del motore SPARK SQL.
* Accesso alla funzionalità SQL SQL: Ha fornito l'accesso alle varie funzionalità del motore Spark SQL, come trasformazioni di dati, aggregazioni e altre operazioni simili a SQL.
Tuttavia, `sqlcontext` è deprecato. È stato sostituito da "Sparksession" nelle versioni successive di Spark. `SparkSession` combina le funzionalità di` sqlcontext`, `hivecontext` e` streamingContext` in un unico punto di ingresso, fornendo un approccio più unificato e semplificato per lavorare con Spark.
In sostanza, se incontri `sqlcontext` nel vecchio codice di scintilla, dovresti migrare nell'uso di` Sparksession`. Servono allo stesso scopo fondamentale, ma "Sparksession" è l'approccio raccomandato e supportato nello sviluppo moderno delle scintille. Entrambi alla fine interagiscono con il motore Spark SQL, ma `Sparksession` offre un'esperienza più integrata.
software © www.354353.com