Skip to content

How to create an Apache Spark 3.0 development cluster on a single machine using Docker

Apache Spark is the most widely used in-memory parallel distributed processing framework in the field of Big Data advanced analytics. The main reasons for its success are the simplicity of use
Read More

AWS DataLake & Apache Flink – 7 luglio 2020, ore 19

Nuovo evento organizzato dalla community Big Data Torino (molto probabilmente sarà nuovamente online, ma seguiranno informazioni più precise nelle prossime settimane). Come sempre ospitiamo due talk: 1) AWS Datalake –
Read More