Bibliotecas escritas en Cuda

instant-ngp

Primitivas de gráficos neuronales instantáneos: NeRF ultrarrápido y más.
  • 13.4k
  • GNU General Public License v3.0

deep-high-resolution-net.pytorch

El proyecto es una implementación oficial de nuestro documento CVPR2019 "Aprendizaje profundo de representación de alta resolución para la estimación de poses humanas".
  • 4.1k
  • MIT

cub

Primitivas cooperativas para CUDA C++. (por NVIDIA).
  • 1.5k
  • BSD 3-clause "New" or "Revised"

cugraph

cuGraph: biblioteca de análisis de gráficos de RAPIDS.
  • 1.3k
  • Apache License 2.0

blocksparse

Núcleos de GPU eficientes para multiplicación y convolución de matriz de bloques dispersos.
  • 948
  • MIT

k2

Algoritmos FSA/FST, diferenciables, con compatibilidad PyTorch.
  • 927
  • Apache License 2.0

nv-wavenet

Implementación de referencia de inferencia de red de ondas autorregresiva en tiempo real.
  • 700
  • BSD 3-clause "New" or "Revised"

nvParse

Analizador rápido CSV basado en GPU.
  • 550
  • Apache License 2.0

instant-ngp-Windows

Primitivas de gráficos neuronales instantáneos: NeRF ultrarrápido y más.
  • 458
  • GNU General Public License v3.0

nccl-tests

Pruebas NCCL.
  • 436
  • BSD 3-clause "New" or "Revised"

MegBA

MegBA: una biblioteca distribuida basada en GPU para el ajuste de paquetes a gran escala.
  • 368
  • Apache License 2.0

raft

RAFT contiene algoritmos y primitivos fundamentales ampliamente utilizados para la ciencia de datos, gráficos y aprendizaje automático. (por rapidsai).
  • 278
  • Apache License 2.0

dietgpu

Implementación en la GPU de un codificador y decodificador de entropía ANS generalizado rápido (sistema numérico asimétrico), con extensiones para la compresión sin pérdidas de tipos de datos numéricos y de otro tipo en aplicaciones HPC/ML.
  • 247
  • MIT

TorchPQ

Búsqueda aproximada del vecino más cercano con cuantificación del producto en GPU en pytorch y cuda.
  • 173
  • MIT

Lantern

  • 163
  • BSD 3-clause "New" or "Revised"

RWKV-CUDA

La versión CUDA del modelo de lenguaje RWKV (https://github.com/BlinkDL/RWKV-LM).
  • 113

cuhnsw

Implementación CUDA del algoritmo de gráfico de mundo pequeño navegable jerárquico.
  • 88
  • Apache License 2.0

CUB

ESTE REPOSITOR SE HA MOVIDO A github.com/nvidia/cub, QUE SE ESPECIFICA AUTOMÁTICAMENTE AQUÍ.
  • 71
  • BSD 3-clause "New" or "Revised"

array-language-comparisons

Una comparación de lenguajes y bibliotecas de matrices: APL, J, BQN, Q, Julia, R, NumPy, Nial, Futhark, SaC y ArrayFire.
  • 60
  • MIT

mish-cuda

Función de activación de Mish para PyTorch (por JunnYu).
  • 48
  • MIT

rocm-examples

  • 39
  • MIT

xgboost-node

Ejecute el modelo XGBoost y haga predicciones en Node.js.
  • 33
  • GNU General Public License v3.0

CUDA-Guide

CUDA Guide.
  • 29

kobra

Motor de juego orientado a la investigación que explora técnicas de renderizado de última generación (por vedavamadathil).
  • 21

CryptoGPU

Análisis de precios de criptomonedas.
  • 16

LSQR-CUDA

Esta es una implementación de LSQR-CUDA escrita por Lawrence Ayers bajo la supervisión de Stefan Guthe del instituto GRIS en la Technische Universität Darmstadt. La biblioteca LSQR fue creada por Chris Paige y Michael Saunders.
  • 11
  • MIT

SBNN

Red neuronal binaria singular basada en operaciones de bits de GPU (consulte nuestro documento SC-19).
  • 10
  • GNU General Public License v3.0

GCGT

Código fuente para el documento: Compressed Graph Traversal basado en GPU.
  • 7
  • MIT

FirstCollisionTimestepRarefiedGasSimulator

Este simulador calcula todas las intersecciones posibles para un paso de tiempo muy pequeño para un modelo de partículas.
  • 2

DOKSparse

tensores DOK dispersos en GPU, pytorch.
  • 1
  • MIT