Cachet Presto gegevens?
Cachet Presto gegevens?

Video: Cachet Presto gegevens?

Video: Cachet Presto gegevens?
Video: Steven Levitt on child carseats 2024, November
Anonim

Presto winkels intermediair gegevens tijdens de periode van taken in zijn buffer cache . Het is echter niet bedoeld als een caching oplossing of een persistente opslaglaag.

Is Presto in dit opzicht een database?

Presto is een gedistribueerd systeem dat op Hadoop draait en een architectuur gebruikt die lijkt op een klassieke massaal parallelle verwerking (MPP) database beheersysteem. Maken Presto uitbreidbaar naar elke gegevensbron, het is ontworpen met opslagabstractie om het eenvoudig te maken om pluggable connectoren te bouwen.

Gebruikt presto ook MapReduce? Presto is een open-source parallelle SQL-uitvoeringsengine. In tegenstelling tot Hive, Presto niet gebruik maken van de kaart verkleinen kader voor de uitvoering ervan. In plaats daarvan, Presto heeft rechtstreeks toegang tot de gegevens via een gespecialiseerde gedistribueerde query-engine die sterk lijkt op die in commerciële parallelle RDBMS'en.

Waarom is Presto snel?

Reden #1: Presto is genoeg Snel MapReduce werkt op een "pull" -model en haalt gegevens uit de voorgaande taken. Een stroomopwaartse fase ontvangt gegevens van zijn stroomafwaartse fasen, zodat de tussenliggende gegevens direct kunnen worden doorgegeven, waardoor de zoekopdracht aanzienlijk wordt sneller.

Hoe werkt Apache Presto?

Presto is een gedistribueerd systeem dat draait op een cluster van knooppunten. Presto's gedistribueerde query-engine is geoptimaliseerd voor interactieve analyse en ondersteunt standaard ANSI SQL, inclusief complexe query's, aggregaties, joins en vensterfuncties. Presto architectuur is eenvoudig en uitbreidbaar.

Aanbevolen: