Modelo de programación potente y confiable y kit de herramientas informáticas

NVIDIA CUDA Toolkit for Mac

NVIDIA CUDA Toolkit for Mac

  -  2.3 GB  -  Gratis
  • Última Versión

    NVIDIA CUDA Toolkit 10.2.89 ÚLTIMO

  • Revisado por

    Daniel Leblanc

  • Sistema Operativo

    macOS 10.13 High Sierra or later

  • Ránking Usuario

    Haga clic para votar
  • Autor / Producto

    NVIDIA Corporation / Enlace Externo

  • Nombre de Fichero

    cuda_10.2.89_mac.dmg

NVIDIA CUDA Toolkit para Mac proporciona un entorno de desarrollo para crear aplicaciones aceleradas por GPU de alto rendimiento. Con CUDA Toolkit para macOS, puede desarrollar, optimizar e implementar sus aplicaciones en sistemas integrados acelerados por GPU, estaciones de trabajo de escritorio, centros de datos empresariales, plataformas basadas en la nube y supercomputadoras HPC. El kit de herramientas incluye bibliotecas aceleradas por GPU, herramientas de depuración y optimización, un compilador C / C ++ y una biblioteca de tiempo de ejecución para implementar su aplicación.

Las bibliotecas CUDA aceleradas por GPU permiten la aceleración directa en múltiples dominios, como álgebra lineal, procesamiento de imágenes y videos, aprendizaje profundo y análisis de gráficos. Para desarrollar algoritmos personalizados, puede usar integraciones disponibles con idiomas y paquetes numéricos de uso común, así como API de desarrollo bien publicadas.

Sus aplicaciones CUDA se pueden implementar en todas las familias de GPU NVIDIA disponibles en las instalaciones y en instancias de GPU en la nube. Utilizando capacidades integradas para distribuir cálculos a través de configuraciones de múltiples GPU, los científicos e investigadores pueden desarrollar aplicaciones que escalen desde estaciones de trabajo de GPU individuales hasta instalaciones en la nube con miles de GPU.

IDE con herramientas gráficas y de línea de comandos para depurar, identificar cuellos de botella de rendimiento en la GPU y la CPU, y proporcionar orientación de optimización sensible al contexto. Desarrolle aplicaciones utilizando un lenguaje de programación que ya conoce, incluidos C, C ++, Fortran y Python.

Para comenzar, navegue a través de recursos en línea para comenzar, guías de optimización, ejemplos ilustrativos y colabore con la comunidad de desarrolladores en rápido crecimiento. ¡Descargue NVIDIA CUDA Toolkit para macOStoday!

Características y destacados

  •     Marca de tiempo de GPU: marca de tiempo de inicio
  •     Método: nombre del método GPU. Esto es "memcpy *" para copias de memoria o el nombre de un núcleo GPU. Las copias de memoria tienen un sufijo que describe el tipo de transferencia de memoria, p. "memcpyDToHasync" significa una transferencia asíncrona desde la memoria del Dispositivo a la memoria del Host
  •     Tiempo de GPU: es el tiempo de ejecución del método en GPU
  •     Tiempo de CPU: es la suma del tiempo de GPU y la sobrecarga de CPU para iniciar ese Método. A nivel de datos generados por el controlador, el tiempo de CPU es solo una sobrecarga de CPU para iniciar el método para métodos sin bloqueo; para los métodos de bloqueo es la suma del tiempo de GPU y la sobrecarga de la CPU. Todos los lanzamientos de kernel por defecto son sin bloqueo. Pero si alguno de los contadores de perfil está habilitado, los lanzamientos de kernel están bloqueados. Las solicitudes de copia de memoria asíncrona en diferentes flujos no bloquean
  •     Id de secuencia: número de identificación de la secuencia
  •     Columnas solo para métodos de kernel
  •     Ocupación: la ocupación es la relación entre el número de urdimbres activos por multiprocesador y el número máximo de urdimbres activos
  •     Contadores de perfiles: consulte la sección de contadores de perfiles para obtener una lista de los contadores compatibles
  •     tamaño de cuadrícula: el número de bloques en la cuadrícula a lo largo de las dimensiones X, Y y Z se muestra como [num_blocks_X num_blocks_Y num_blocks_Z] en una sola columna
  •     tamaño de bloque: el número de hilos en un bloque a lo largo de las dimensiones X, Y y Z se muestra como [num_threads_X num_threads_Y num_threads_Z]] en una sola columna
  •     dyn smem por bloque: tamaño de memoria compartida dinámica por bloque en bytes
  •     sta smem por bloque: tamaño de memoria compartida estática por bloque en bytes
  •     reg por hilo: número de registros por hilo
  •     Columnas solo para métodos de memcopy
  •     tamaño de transferencia de memoria: tamaño de transferencia de memoria en bytes
  •     tipo de transferencia de memoria de host: especifica si una transferencia de memoria usa memoria "paginable" o "bloqueada por página"


  • NVIDIA CUDA Toolkit 10.2.89 Capturas de Pantalla

    Las imágenes a continuación han sido redimensionadas. Haga clic en ellos para ver las capturas de pantalla en tamaño completo.

    NVIDIA CUDA Toolkit 10.2.89 Captura de Pantalla 1