AUR (en) - llama.cpp-cuda

Search Criteria

Enter search criteria

Search by

Keywords

Out of Date

Sort by

Sort order

Per page

Package Details: llama.cpp-cuda b5155-1

Package Actions

Git Clone URL:	https://aur.archlinux.org/llama.cpp-cuda.git (read-only, click to copy)
Package Base:	llama.cpp-cuda
Description:	Port of Facebook's LLaMA model in C/C++ (with NVIDIA CUDA optimizations)
Upstream URL:	https://github.com/ggerganov/llama.cpp
Licenses:	MIT
Conflicts:	libggml, llama.cpp
Provides:	llama.cpp
Submitter:	txtsd
Maintainer:	txtsd
Last Packager:	txtsd
Votes:	6
Popularity:	0.49
First Submitted:	2024-10-26 20:17 (UTC)
Last Updated:	2025-04-19 05:44 (UTC)

Dependencies (13)

blas-openblas
blas64-openblas
cuda (cuda11.1^AUR, cuda-12.2^AUR, cuda12.0^AUR, cuda11.4^AUR, cuda11.4-versioned^AUR, cuda12.0-versioned^AUR)
curl (curl-git^AUR, curl-c-ares^AUR)
gcc-libs (gcc-libs-git^AUR, gccrs-libs-git^AUR, gcc11-libs^AUR, gcc-libs-snapshot^AUR)
glibc (glibc-git^AUR, glibc-linux4^AUR, glibc-eac^AUR)
openmp
python (python37^AUR, python311^AUR, python310^AUR)
python-numpy (python-numpy-git^AUR, python-numpy1^AUR, python-numpy-mkl-bin^AUR, python-numpy-mkl-tbb^AUR, python-numpy-mkl^AUR)
python-sentencepiece^AUR (python-sentencepiece-git^AUR)
cmake (cmake-git^AUR, cmake3^AUR) (make)
git (git-git^AUR, git-gl^AUR) (make)
python-pytorch (python-pytorch-cxx11abi^AUR, python-pytorch-cxx11abi-opt^AUR, python-pytorch-cxx11abi-cuda^AUR, python-pytorch-cxx11abi-opt-cuda^AUR, python-pytorch-cxx11abi-rocm^AUR, python-pytorch-cxx11abi-opt-rocm^AUR, python-pytorch-cuda, python-pytorch-opt, python-pytorch-opt-cuda, python-pytorch-opt-rocm, python-pytorch-rocm) (optional)

Required by (0)

Sources (4)

Pinned Comments

txtsd commented on 2024-10-26 20:17 (UTC) (edited on 2024-12-06 14:15 (UTC) by txtsd)

Alternate versions

llama.cpp
llama.cpp-vulkan
llama.cpp-sycl-fp16
llama.cpp-sycl-fp32
llama.cpp-cuda
llama.cpp-cuda-f16
llama.cpp-hip

Latest Comments

« First ‹ Previous 1 2 3

Poscat commented on 2024-11-24 01:54 (UTC) (edited on 2024-11-24 01:54 (UTC) by Poscat)

❯ ls -lh /usr/bin/llama*
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-batched
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-batched-bench
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-bench
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-cli
-rwxr-xr-x 1 root root 814M Nov 23 00:02 /usr/bin/llama-convert-llama2c-to-ggml
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-cvector-generator
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-embedding
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-eval-callback
-rwxr-xr-x 1 root root 814M Nov 23 00:02 /usr/bin/llama-export-lora
-rwxr-xr-x 1 root root 814M Nov 23 00:02 /usr/bin/llama-gbnf-validator
-rwxr-xr-x 1 root root 111K Nov 23 00:02 /usr/bin/llama-gguf
-rwxr-xr-x 1 root root 131K Nov 23 00:02 /usr/bin/llama-gguf-hash
-rwxr-xr-x 1 root root 814M Nov 23 00:02 /usr/bin/llama-gguf-split
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-gritlm
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-imatrix
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-infill
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-llava-cli
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-lookahead
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-lookup
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-lookup-create
-rwxr-xr-x 1 root root  31K Nov 23 00:02 /usr/bin/llama-lookup-merge
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-lookup-stats
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-minicpmv-cli
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-parallel
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-passkey
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-perplexity
-rwxr-xr-x 1 root root 814M Nov 23 00:02 /usr/bin/llama-quantize
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-quantize-stats
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-retrieval
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-save-load-state
-rwxr-xr-x 1 root root 817M Nov 23 00:02 /usr/bin/llama-server
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-simple
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-simple-chat
-rwxr-xr-x 1 root root 816M Nov 23 00:02 /usr/bin/llama-speculative
-rwxr-xr-x 1 root root 815M Nov 23 00:02 /usr/bin/llama-tokenize

txtsd commented on 2024-11-15 10:19 (UTC)

Wait can you show me individual file sizes? That's not right.

txtsd commented on 2024-11-15 10:18 (UTC)

@brauliobo Such is life with CUDA :( I can't even build this on my CI because of the size requirements

brauliobo commented on 2024-11-15 10:17 (UTC)

the build is taking 45gb! just the build/bin folder takes 38gb:

braulio @ whitebeast ➜  bin git:(master)  pwd
/home/braulio/.cache/yay/llama.cpp-cuda/src/build/bin
braulio @ whitebeast ➜  bin git:(master)  du -h --max-depth=1
38G     .
braulio @ whitebeast ➜  bin git:(master)  ls
llama-batched                  llama-gbnf-validator  llama-lookup         llama-quantize         llama-vdot          test-grammar-integration     test-sampling
llama-batched-bench            llama-gguf            llama-lookup-create  llama-quantize-stats   rpc-server          test-grammar-parser          test-tokenizer-0
llama-bench                    llama-gguf-hash       llama-lookup-merge   llama-retrieval        test-arg-parser     test-json-schema-to-grammar  test-tokenizer-1-bpe
llama-cli                      llama-gguf-split      llama-lookup-stats   llama-save-load-state  test-autorelease    test-llama-grammar           test-tokenizer-1-spm
llama-convert-llama2c-to-ggml  llama-gritlm          llama-minicpmv-cli   llama-server           test-backend-ops    test-log
llama-cvector-generator        llama-imatrix         llama-parallel       llama-simple           test-barrier        test-model-load-cancel
llama-embedding                llama-infill          llama-passkey        llama-simple-chat      test-c              test-quantize-fns
llama-eval-callback            llama-llava-cli       llama-perplexity     llama-speculative      test-chat-template  test-quantize-perf
llama-export-lora              llama-lookahead       llama-q8dot          llama-tokenize         test-grad0          test-rope

txtsd commented on 2024-10-26 20:17 (UTC) (edited on 2024-12-06 14:15 (UTC) by txtsd)

Alternate versions

llama.cpp
llama.cpp-vulkan
llama.cpp-sycl-fp16
llama.cpp-sycl-fp32
llama.cpp-cuda
llama.cpp-cuda-f16
llama.cpp-hip

« First ‹ Previous 1 2 3

Arch Linux User Repository

Search Criteria

Package Details: llama.cpp-cuda b5155-1

Package Actions

Dependencies (13)

Required by (0)

Sources (4)

Pinned Comments

txtsd commented on 2024-10-26 20:17 (UTC) (edited on 2024-12-06 14:15 (UTC) by txtsd)

Latest Comments

Poscat commented on 2024-11-24 01:54 (UTC) (edited on 2024-11-24 01:54 (UTC) by Poscat)

txtsd commented on 2024-11-15 10:19 (UTC)

txtsd commented on 2024-11-15 10:18 (UTC)

brauliobo commented on 2024-11-15 10:17 (UTC)

txtsd commented on 2024-10-26 20:17 (UTC) (edited on 2024-12-06 14:15 (UTC) by txtsd)