Links dos pots sobre a série “SQL SERVER 2019 – BIG DATA CLUSTERS”
Série de estudos sobre o Big Data Clusters, engine adicionada no SQL Server 2019.
Aqui vou adicionando todos os posts relacionado a este assunto.
Espero que esse conteúdo possa ajudar você durante os estudos.
Série – SQL Server Big Data Clusters
- #01 – Big Data Cluters – Start Here
Neste post, estudamos os motivadores e principais conceitos do Big Data Clusters, uma conceituação inicial sobre o assunto que será abordado com mais detalhes nos artigos posteriores.
- #02 – Big Data Clusters – Arquitetura
Neste post, estudamos a arquitetura do BDC, entendendo o Storage Pool, Data Pool e Compute Pool. Também comento sobre integração com Spark e HDFS com filas orquestradas pelo Yarn.
- #03 – Big Data Clusters – Instalação e Configuração do BDC (com AKS)
Neste post, o foco foi a instação e configuração do Big Data Cluster sob um cluster de Kubernetes no AKS.
- #04 – Big Data Clusters – Ingestão dados no Storage Pool (HDFS)
Neste post acessamos o HDFS via Azure Data Studio e via hdfs shell, criando diretórios e realizando upload/put de arquivos no HDFS.
- #05 – Big Data Clusters – Principais Tools para trabalhar com BDC
Neste post relacionei algumas ferramentas (tools) essenciais para a instalação e configuração do BDC e principalmente para uso no dia a dia.
- #06 – Big Data Clusters – Capturando Tweets
Neste post começamos a montar uma arquitetura com o Big Data Clusters para capturados dos o Twitter.