Tesla comienza a fabricar su superordenador Dojo: entrenará sus vehículos autónomos

Tesla comienza a fabricar su superordenador Dojo: entrenará sus vehículos autónomos


Tesla ha terminado el diseño de su superordenador Dojo, lo que significa que no falta mucho para que este entre en producción. Al menos esto es lo que la empresa automovilística de Elon Musk afirma en su último informe financiero. No olvidemos que ellos han optado por desarrollar y fabricar buena parte del equipamiento necesario para que sus coches sean totalmente autónomos. Todo ello en una estructura de integración vertical que va desde el hardware y software integrado en sus vehículos hasta los sistemas de entrenamiento y el desarrollo de los modelos de aprendizaje.

En la actualidad, Tesla utiliza sistemas basados en las GPU de NVIDIA, sin embargo, el superordenador Dojo se ha desarrollado con chips creados internamente por la compañía y forma parte de un proyecto que empezó en 2019. ¿El objetivo? Tener un ordenador con la capacidad de realizar un trillón de operaciones por segundo o 1.000.000.000.000.000.000, es decir, una enorme cifra de 18 ceros.

Así es el superordenador Tesla Dojo

Al tratarse de un superordenador no estamos hablando de una unidad compacta, ya en 2021 mostraron los primeros prototipos del chip D1 que formara parte de Tesla Dojo. Este se empleará para entrenar a sus coches y que estos sean totalmente autónomos. En realidad, el objetivo es ir distribuyendo los diferentes Tesla Dojo por todo el mundo para entrenar los diferentes vehículos de la marca para tareas como pueden ser el transporte de mercaderías o de personas.

No olvidemos que todas las empresas constructoras de automóviles están centrando sus esfuerzos en hacer totalmente autónomos a sus vehículos y en este caso Tesla no se puede quedar atrás. La diferencia con el resto es que han decidido optar por construir cada uno de los elementos de su tecnología. Es decir, al contrario de otras marcas, el superordenador que usaran para entrenar a los diferentes vehículos usará chips diseñados por la propia marca.

El chip D1, el corazón de Tesla Dojo, ofrece 360 núcleos por chip

La CPU principal de Dojo es el chip D1, el cual se ha diseñado para ser fabricado bajo el nodo N7 o de 7 nm de TSMC. Está compuesto por 50.000 millones de transistores, lo que hace que no sea precisamente un chip pequeño, ya que tiene un área de 645 milímetros cuadrados.

Al ser un chip para IA la configuración de cada chip utilizado en Tesla Dojo es la de un array sistólico, en el que los diferentes núcleos están colocados en matriz. De tal manera que la información e instrucciones a ejecutar vienen de las unidades colindantes. Para ello cada núcleo tiene un router que lo comunica con sus vecinos.

En total, los núcleos se encuentran organizados en una matriz de 18 filas y 20 columnas para un total de 360 núcleos, de los cuales 354 de ellos están disponibles para las aplicaciones a una velocidad de reloj de 2,00 GHz con un TDP de 400W para todo el chip.

Anatomía de cada uno de los núcleos del chip D1

En cuanto a las características de cada uno de los núcleos en el interior del chip D1, estas son las siguientes:

Se trata de una CPU superescalar de 64 bits.

Hasta cuatro instrucciones simultáneas.
Capacidad multihilo con hasta cuatro hilos de ejecución al mismo tiempo.

No se ha diseñado para soportar un sistema operativo moderno, ya que carece de memoria virtual y de mecanismos de protección de memoria.
En cuanto a la ISA que ha empleado Tesla para la creación del chip D1, esta es RISC-V.
Cada uno de los núcleos tiene 2 unidades lógico-aritméticas, una para coma flotante y otra para enteros, así como dos unidades de cálculo de direcciones.

En el caso de las dos primeras están son lo que llamamos SIMD sobre registro, es decir, pueden hacer una instrucción de 64 bits o dos de 32 bits, o cuatro de 16 bits por unidad en un mismo ciclo de reloj.
Sin embargo, la particularidad del D1 en Tesla Dojo es que soporta hasta 16 tipos de datos y se pueden combinar entre ellos.
A todo ello hay que añadir una unidad de cálculo tensorial con una configuración 8 x 8 x 4.

Arquitectura de memoria

Debido a que cada uno de los chips D1 es un procesador para IA, no sigue el mismo esquema que un procesador convencional. Ya que cada uno de sus núcleos carece de un sistema de cachés, pues lo hace es servir memoria local para ejecutar sus algoritmos, la cual tiene una capacidad de 1,25 MB SRAM por núcleo. Esto significa que hay 440 MB de memoria por cada Tesla D1, si contamos todos los núcleos.

Configuración completa del Tesla Dojo

Sin embargo, los D1 no van en solitario, ya que Tesla los agrupa en lo que ellos llaman un Training Tile, donde tenemos 25 de estos chips en una configuración de 5 x 5. En conjunto alcanzan 11 GB de memoria y 9 PetaFLOPS de potencia de cálculo. En cuanto a la memoria externa, cada Training Tile viene acompañado de memoria HBM2E o HBM3, hasta 160 GB de memoria por unidad.

A partir de aquí ya podemos completar la organización del superordenador de Elon Musk, el cual está configurado de la siguiente manera:

Seis “Training Tiles” forman lo que es un System Tray.

960 GB de memoria HBM por System Tray.
66 GB de memoria local.

Hay 2 System Tray por gabinete.

108 PetaFLOPS de potencia agregada.
1.920 GB de memoria HBM por gabinete.
132 GB de memoria local.

10 Gabinetes por Tesla Dojo

200 GB de memoria RAM para todo un superordenador Tesla Dojo.
1.320 GB de memoria local.
1.080 PetaFLOPS o 1,08 ExaFLOPS de potencia en total.

No hay duda que el Tesla Dojo es uno de los superordenadores más potentes del mundo para IA. En todo caso, la pregunta final que nos queda es saber cuántos pretende desplegar la empresa de Elon Musk en todo el mundo. De cara a los años venideros será interesante ver cuál de los fabricantes acaba teniendo el mejor sistema de conducción totalmente autónoma. En todo caso, y ya para terminar, se puede decir que en este caso no quieren volverse dependientes del hardware de NVIDIA y tampoco de las librerías CUDA, ya que los algoritmos del chip D1 se programaran usando librerías desarrolladas internamente.

La entrada Tesla comienza a fabricar su superordenador Dojo: entrenará sus vehículos autónomos aparece primero en El Chapuzas Informático.