Modelo y kit de programación potentes y fiables

NVIDIA CUDA Toolkit for Mac

NVIDIA CUDA Toolkit for Mac

  -  305 MB  -  Gratis
  • Última Versión

    NVIDIA CUDA Toolkit 12.8 (Nsight Systems 2024.6.2) ÚLTIMO

  • Revisado por

    Daniel Leblanc

  • Sistema Operativo

    macOS 10.13 High Sierra or later

  • Ránking Usuario

    Haga clic para votar
  • Autor / Producto

    NVIDIA Corporation / Enlace Externo

  • Nombre de Fichero

    nsightsystems-macos-public-2024.6.2.225-3524440.dmg

NVIDIA CUDA Toolkit para Mac proporciona un entorno de desarrollo para crear aplicaciones de alto rendimiento aceleradas por GPU.

Con el CUDA Toolkit para macOS, puede desarrollar, optimizar e implementar sus aplicaciones en sistemas integrados acelerados por GPU, estaciones de trabajo de escritorio, centros de datos empresariales, plataformas basadas en la nube y supercomputadoras HPC.



El kit de herramientas incluye bibliotecas aceleradas por GPU, herramientas de depuración y herramientas de optimización, un compilador C/C++ y una biblioteca de tiempo de ejecución para implementar su aplicación.

Las bibliotecas CUDA aceleradas por GPU permiten la aceleración directa en múltiples dominios, como álgebra lineal, procesamiento de imágenes y video, aprendizaje profundo y análisis de gráficos. Para desarrollar algoritmos personalizados, puede utilizar integraciones disponibles con lenguajes y paquetes numéricos de uso común, así como API de desarrollo bien publicadas.

Sus aplicaciones CUDA se pueden implementar en todas las NVIDIA familias de GPU disponibles en las instalaciones y en instancias de GPU en la nube. Utilizando las capacidades integradas para distribuir cálculos en configuraciones multi-GPU, los científicos e investigadores pueden desarrollar aplicaciones que escalan desde estaciones de trabajo de GPU individuales hasta instalaciones en la nube con miles de GPU.

IDE con herramientas gráficas y de línea de comandos para depurar, identificar cuellos de botella de rendimiento en la GPU y la CPU, y proporcionar orientación de optimización con contexto. Desarrolle aplicaciones utilizando un lenguaje de programación que ya conoce, incluidos C, C++, Fortran y Python.

Para comenzar, explore los recursos de inicio en línea, las guías de optimización, los ejemplos ilustrativos y colabore con la comunidad de desarrolladores en rápido crecimiento. ¡Descargue NVIDIA CUDA Toolkit para macOS hoy!

Las herramientas de host de macOS proporcionadas son:

Nsight Systems - una herramienta de seguimiento de perfil y línea de tiempo del sistema que admite GPU Pascal y posteriores

Nsight Compute - un perfilador de kernel CUDA que admite Volta y nuevas GPU

NOTA: que la versión de host de MacOS de estas herramientas, obsoleta en versiones anteriores, se ha eliminado a partir de CUDA Toolkit 12.5.
Siga estos enlaces para revisar los sistemas operativos compatibles con estas herramientas.

Visual Profiler - una herramienta de seguimiento de perfil y línea de tiempo del kernel y sistema CUDA que admite GPU más antiguas

cuda-gdb - un depurador de aplicaciones CUDA para GPU y CPU

Características y aspectos destacados
  • Marca de tiempo de GPU: Marca de tiempo de inicio
  • Método: nombre del método de GPU. Esto es "memcpy*" para copias de memoria o el nombre de un kernel de GPU. Las copias de memoria tienen un sufijo que describe el tipo de transferencia de memoria, p. ej., "memcpyDToHasync" significa una transferencia asíncrona de la memoria del dispositivo a la memoria del host
  • Tiempo de GPU: es el tiempo de ejecución del método en la GPU
  • Tiempo de CPU: es la suma del tiempo de GPU y la sobrecarga de la CPU para iniciar ese método. A nivel de datos generados por el controlador, el tiempo de CPU es solo la sobrecarga de la CPU para iniciar el método para métodos no bloqueantes; para los métodos bloqueantes, es la suma del tiempo de GPU y la sobrecarga de la CPU. Todos los lanzamientos de kernel son no bloqueantes de forma predeterminada. Pero si se habilitan los contadores del perfilador, los lanzamientos del kernel son bloqueantes. Las solicitudes de copia de memoria asíncronas en diferentes flujos no son bloqueantes
  • ID de flujo: número de identificación para el flujo
  • Solo columnas para métodos de kernel
  • Ocupación: la ocupación es la relación entre el número de warps activos por multiprocesador y el número máximo de warps activos
  • Contadores del perfilador: consulte la sección de contadores del perfilador para obtener una lista de los contadores compatibles
  • Tamaño de la cuadrícula: el número de bloques en la cuadrícula a lo largo de las dimensiones X, Y y Z se muestra como [num_blocks_X num_blocks_Y num_blocks_Z] en una sola columna
  • Tamaño del bloque: el número de subprocesos en un bloque a lo largo de las dimensiones X, Y y Z se muestra como [num_threads_X num_threads_Y num_threads_Z] en una sola columna
  • smem dinámico por bloque: tamaño de la memoria compartida dinámica por bloque en bytes
  • smem estático por bloque: tamaño de la memoria compartida estática por bloque en bytes
  • reg por subproceso: número de registros por subproceso
  • Solo columnas para métodos de memcopia
  • Tamaño de la transferencia de memoria: tamaño de la transferencia de memoria en bytes
  • Tipo de transferencia de memoria del host: especifica si una transferencia de memoria utiliza memoria "paginable" o "bloqueada en página"
VENTAJAS
  • Enorme potencia de procesamiento paralelo
  • Optimizado para GPU NVIDIA
  • Sólido soporte para desarrolladores
  • Amplias aplicaciones de IA y HPC
  • Integración perfecta con bibliotecas
DESVENTAJAS
  • Limitado a GPU NVIDIA
  • Curva de aprendizaje pronunciada
  • Alto consumo de energía
  • Costos de actualización de hardware
  • No es ideal para todas las cargas de trabajo
También disponible: Descargar NVIDIA CUDA Toolkit para Windows

  • NVIDIA CUDA Toolkit 12.8 (Nsight Systems 2024.6.2) Capturas de Pantalla

    Las imágenes a continuación han sido redimensionadas. Haga clic en ellos para ver las capturas de pantalla en tamaño completo.

    NVIDIA CUDA Toolkit 12.8 (Nsight Systems 2024.6.2) Captura de Pantalla 1