Supercomputador é construído em 20 semanas de forma remota com ajuda de pequeno robô

A Nvidia anunciou seus planos de começar a construir um supercomputador projetado especificamente para aplicativos de machine learning 20 dias antes de concluir o projeto. A empresa anunciou que o Cambridge-1 está quase instalado e em funcionamento. 

O equipamento desenvolvido com um investimento de US$ 51,7 milhões está em um dos prédios do provedor de data center Kao Data, em Cambridge, passando por testes finais. Em breve, os cientistas poderão começar a executar projetos com o dispositivo, neste caso, com foco na pesquisa de saúde, de acordo com publicação do site ZDNet

Com o poder computacional extra habilitado pelo Cambridge-1, os cientistas serão capazes de resolver problemas baseados em dados que antes eram difíceis de controlar, como diagnosticar melhor os pacientes e identificar os tratamentos apropriados; mas também estão confiantes de que o dispositivo pode causar avanços na pesquisa médica, por exemplo, com a descoberta de novos medicamentos.

O Cambridge-1, supercomputador da NVIDIA, foi construído em 20 semanas com equipes de pesquisadores trabalhando remotamente. Crédito: Kao Data

Operação e montagem

Para Spencer Lamb, Vice-Presidente de Vendas e Marketing da Kao Data, o Cambridge-1 entrou em seus primeiros estágios de operação em um tempo “extraordinário”, sobretudo durante a pandemia.

Segundo publicação do site ZDNet, o Cambridge-1 foi projetado especificamente para aplicativos de machine learning, alimentado por 80 dos sistemas DGX A100 da Nvidia, que são construídos para executar software de IA em grande escala. Apenas 20 DGX A100 fornecem o equivalente a centenas de CPUs, permitindo que Cambridge-1 empacote um total de 400 petaflops de desempenho de IA e efetivamente tornando o sistema o computador mais rápido do país, diz o site.


Continua depois da publicidade


Devido às medidas de isolamento social, o supercomputador precisou ser construído à distância, com pesquisadores nos Estados Unidos e no Reino Unido. "A equipe da Nvidia está baseada na Costa Oeste [Califórnia, EUA] e normalmente eles teriam vindo às instalações para dar uma olhada. O que eles tinham que fazer era gerenciar a instalação remotamente, sem estar fisicamente no prédio", disse ao ZdNet. "A realidade que descobrimos é que quanto menos humanos você tiver lá, que não são estritamente necessários, melhor você pode fazer o trabalho com mais eficácia. Com os olhos no solo, trabalhando em parceria com a equipe remota da Nvidia, alcançaram o resultado desejado, sem a necessidade de enviar fisicamente indivíduos da Nvidia até Cambridge”.

Montar o supercomputador fisicamente com uma equipe que estava sendo instruída à distância foi desafiador, de acordo com Marc Hamilton, Vice-Presidente de Arquitetura e Engenharia de Soluções da empresa. No entanto, a equipe contou com o suporte de um pequeno robô da Nvidia levado aos Estados Unidos para acompanhar de perto o que ocorria no prédio. "Uma coisinha sobre duas rodas que parece um tablet em uma vara”, descreve Hamilton.

“Com a Kao, é claro, não tínhamos nenhum funcionário no local do prédio”, disse Hamilton ao ZDNet, diferenciando da experiência que tiveram com o robô na construção do supercomputador Selene. "Então, uma das pequenas melhorias que nossos engenheiros fizeram é que eles colocaram portas de vidro deslizantes que abrem automaticamente. Isso é uma coisa tão trivial - definitivamente não é supercomputação - mas eu nunca tinha visto um supercomputador em um data center com portas deslizantes".

Os racks do tamanho de uma geladeira que compõem um supercomputador são todos feitos de computadores menores, cada um com dez cabos de fibra óptica. “Isso é muita montagem manual se você tiver que conectar todos aqueles milhares de cabos dentro do data center”, diz Hamilton. “No início, para ir de um supercomputador a outro, refizemos e recondicionamos todos aqueles milhares de cabos. Foi então que dissemos: 'Queremos tornar a construção de um supercomputador tão fácil quanto construir blocos de Lego'. Por isso, projetamos um supercomputador modular e, tanto quanto possível, pré-fabricado na fábrica".

A Nvidia começou a implementar esta nova abordagem em 2018, diz a publicação, para a terceira geração de supercomputadores que foi projetada pela empresa, e com os mesmos princípios aplicados ao Cambridge-1. Pacotes de centenas de cabos de fibra óptica foram conectados e pré-embalados e, em seguida, enviados para o data center, onde os engenheiros só ficaram com a tarefa de conectar uma extremidade aos servidores e outra aos switches da rede, diz o site.

"Agora estamos principalmente testando e ajustando as coisas, antes de pensarmos onde colocaremos nossos supercomputadores", disse Hamilton. Ele espera que até meados de abril, quando a Nvidia realizar seu evento anual, GPU Technology Conference, os primeiros resultados de pesquisa de alguns dos primeiros projetos executados em Cambridge-1 sejam anunciados.