-
Última Versión
NVIDIA CUDA Toolkit 12.8 (Nsight Systems 2024.6.2) ÚLTIMO
-
Revisado por
-
Sistema Operativo
macOS 10.13 High Sierra or later
-
Ránking Usuario
Haga clic para votar -
Autor / Producto
-
Nombre de Fichero
nsightsystems-macos-public-2024.6.2.225-3524440.dmg
Con el CUDA Toolkit para macOS, puedes desarrollar, optimizar e implementar tus aplicaciones en sistemas embebidos acelerados por GPU, estaciones de trabajo de escritorio, centros de datos empresariales, plataformas basadas en la nube y superordenadores HPC.
El kit de herramientas incluye bibliotecas aceleradas por GPU, herramientas de depuración y optimización, un compilador C/C++ y una biblioteca en tiempo de ejecución para implementar tu aplicación.
Las bibliotecas CUDA aceleradas por GPU permiten una aceleración inmediata en múltiples dominios como álgebra lineal, procesamiento de imágenes y video, aprendizaje profundo y análisis de gráficos. Para desarrollar algoritmos personalizados, puedes usar las integraciones disponibles con lenguajes y paquetes numéricos de uso común, así como APIs de desarrollo bien documentadas.
Tus aplicaciones CUDA pueden implementarse en todas las familias de GPU NVIDIA disponibles en local y en instancias de GPU en la nube. Usando las capacidades integradas para distribuir cómputos en configuraciones multi-GPU, científicos e investigadores pueden desarrollar aplicaciones que escalan desde estaciones de trabajo con una sola GPU hasta instalaciones en la nube con miles de GPUs.
IDE con herramientas gráficas y de línea de comandos para depurar, identificar cuellos de botella de rendimiento en la GPU y CPU, y proporcionar orientación de optimización sensible al contexto. Desarrolla aplicaciones usando un lenguaje de programación que ya conoces, incluyendo C, C++, Fortran y Python.
Para comenzar, explora los recursos de introducción en línea, las guías de optimización, los ejemplos ilustrativos y colabora con la comunidad de desarrolladores en rápido crecimiento. ¡Descarga NVIDIA CUDA Toolkit para macOS hoy mismo!
Las herramientas de host de macOS proporcionadas son:
Nsight Systems - una herramienta de perfilado de sistema y seguimiento de línea de tiempo que soporta GPUs Pascal y más recientes
Nsight Compute - un perfilador de kernel CUDA que soporta GPUs Volta y nuevas
NOTA: que la versión para host de MacOS de estas herramientas, deprecadas en versiones anteriores, ha sido eliminada a partir de CUDA Toolkit 12.5.
Sigue estos enlaces para revisar los sistemas operativos compatibles con estas herramientas.
Visual Profiler - un perfilador de kernel CUDA y de sistema y herramienta de seguimiento de línea de tiempo que soporta GPUs más antiguas
cuda-gdb - un depurador de aplicaciones CUDA para GPU y CPU
Características y Destacados
- Marca de tiempo de GPU: Marca de tiempo de inicio
- Método: Nombre del método de GPU. Esto es o "memcpy*" para copias de memoria o el nombre de un kernel de GPU. Las copias de memoria tienen un sufijo que describe el tipo de transferencia de memoria, por ejemplo, "memcpyDToHasync" significa una transferencia asíncrona de la memoria del dispositivo a la memoria del host
- Tiempo de GPU: Es el tiempo de ejecución del método en la GPU
- Tiempo de CPU: Es la suma del tiempo de GPU y la sobrecarga de CPU para lanzar ese Método. A nivel de datos generados por el controlador, el tiempo de CPU es solo la sobrecarga de CPU para lanzar el Método para Métodos no bloqueantes; para métodos bloqueantes es la suma del tiempo de GPU y la sobrecarga de CPU. Todos los lanzamientos de kernel por defecto no son bloqueantes. Pero si se habilitan contadores de perfilador, los lanzamientos de kernel son bloqueantes. Las solicitudes de copia de memoria asíncronas en diferentes flujos no son bloqueantes
- ID de Flujo: Número de identificación para el flujo
- Columnas solo para métodos de kernel
- Ocupación: La ocupación es la relación entre el número de warps activos por multiprocesador y el número máximo de warps activos
- Contadores de perfilador: Consulta la sección de contadores de perfilador para una lista de contadores soportados
- Tamaño de la rejilla: El número de bloques en la rejilla a lo largo de las dimensiones X, Y y Z se muestra como [num_blocks_X num_blocks_Y num_blocks_Z] en una sola columna
- Tamaño del bloque: El número de hilos en un bloque a lo largo de las dimensiones X, Y y Z se muestra como [num_threads_X num_threads_Y num_threads_Z]] en una sola columna
- memoria compartida dinámica por bloque: Tamaño de la memoria compartida dinámica por bloque en bytes
- memoria compartida estática por bloque: Tamaño de la memoria compartida estática por bloque en bytes
- registros por hilo: Número de registros por hilo
- Columnas solo para métodos de copia de memoria
- tamaño de transferencia de memoria: Tamaño de la transferencia de memoria en bytes
- tipo de transferencia de memoria de host: Especifica si una transferencia de memoria utiliza memoria "paginable" o "bloqueada en página"
- Gran Poder de Procesamiento Paralelo
- Optimizado para GPUs NVIDIA
- Fuerte Soporte para Desarrolladores
- Amplias Aplicaciones de IA y HPC
- Integración Perfecta con Bibliotecas
- Limitado a GPUs NVIDIA
- Curva de Aprendizaje Pronunciada
- Alto Consumo de Energía
- Costos de Actualización de Hardware
- No Ideal para Todas las Cargas de Trabajo
Traducido por el Equipo de Localización de Filehorse
OperaOpera 119.0 Build 5497.131
PhotoshopAdobe Photoshop CC 2024 25.12
CapCutCapCut 6.4.0
BlueStacksBlueStacks Air 5.21.650
Adobe AcrobatAdobe Acrobat Pro 2025.001.20529
MacKeeperMacKeeper 7.0
Hero WarsHero Wars - Online Action Game
SemrushSemrush - Keyword Research Tool
CleanMyMacCleanMyMac X 5.0.6
4DDiG4DDiG Mac Data Recovery 5.2.2
Comentarios y Críticas de Usuarios