<div dir="auto">note, openCL is different to openGL, mostly being more about more accurate computations.<div dir="auto"><br></div><div dir="auto">On AMD FX4300, 32bit userspace but llvm probably uses avx?</div><div dir="auto"><br></div><div dir="auto"><br></div><div dir="auto"><div dir="auto">guest@slax:/dev/shm/mesa/BUILD$ RUSTICL_ENABLE=llvmpipe  clpeak</div><div dir="auto"><br></div><div dir="auto">Platform: rusticl</div><div dir="auto">  Device: llvmpipe (LLVM 20.1.3, 256 bits)</div><div dir="auto">    Driver version  : 25.2.0-devel (git-845611bb43) (Linux x86)</div><div dir="auto">    Compute units   : 8</div><div dir="auto">    Clock frequency : 300 MHz</div><div dir="auto"><br></div><div dir="auto">    Global memory bandwidth (GBPS)</div><div dir="auto">      float   : 3.72</div><div dir="auto">      float2  : 4.08</div><div dir="auto">      float4  : 3.59</div><div dir="auto">      float8  : 2.81</div><div dir="auto">      float16 : 2.09</div><div dir="auto"><br></div><div dir="auto">    Single-precision compute (GFLOPS)</div><div dir="auto">      float   : 14.67</div><div dir="auto">      float2  : 17.86</div><div dir="auto">      float4  : 15.99</div><div dir="auto">      float8  : 14.72</div><div dir="auto">      float16 : 14.63</div><div dir="auto"><br></div><div dir="auto">    No half precision support! Skipped</div><div dir="auto"><br></div><div dir="auto">    No double precision support! Skipped</div><div dir="auto"><br></div><div dir="auto">    Integer compute (GIOPS)</div><div dir="auto">      int   : 13.89</div><div dir="auto">      int2  : 13.25</div><div dir="auto">      int4  : 12.85                                                                                      int8  : 13.04</div><div dir="auto">      int16 : 11.51</div><div dir="auto"><br></div><div dir="auto">    Integer compute Fast 24bit (GIOPS)                                                                   int   : 13.65</div><div dir="auto">      int2  : 13.29</div><div dir="auto">      int4  : 13.23                                                                                      int8  : 12.90</div><div dir="auto">      int16 : 11.08</div><div dir="auto"><br></div><div dir="auto">    Transfer bandwidth (GBPS)</div><div dir="auto">      enqueueWriteBuffer              : 2.82                                                             enqueueReadBuffer               : 1.08</div><div dir="auto">      enqueueWriteBuffer non-blocking : 2.89</div><div dir="auto">      enqueueReadBuffer non-blocking  : 1.02</div><div dir="auto">      enqueueMapBuffer(for read)      : 1.15</div><div dir="auto">        memcpy from mapped ptr        : 3.02</div><div dir="auto">      enqueueUnmap(after write)       : 2.22</div><div dir="auto">        memcpy to mapped ptr          : 3.01</div><div dir="auto"><br></div><div dir="auto">    Kernel launch latency : 21.55 us</div><div dir="auto"><br></div><div dir="auto">guest@slax:/dev/shm/mesa/BUILD$</div><div dir="auto"><br></div><div dir="auto">command to build somewhat minimal mesa (llvmpipe + amd):</div><div dir="auto"><br></div><div dir="auto"><br></div><div dir="auto">meson ../ --prefix=/usr/X11R7 --libdir=lib --strip --buildtype debugoptimized -Degl=enabled -Dosmesa=true -Dplatforms=x11 -Dgallium-drivers=r600,radeonsi,llvmpipe -Dvulkan-drivers=amd,swrast  -Dgallium-nine=true -Dgallium-va=enabled  -Dgallium-xa=disabled -Dgallium-rusticl=true -Dllvm=enabled -Drust_std=2021  -Dvideo-codecs="all"</div><div dir="auto"><br></div><div dir="auto">of course you can set your own prefix ( I have X installed into non-default location).</div><div dir="auto"><br></div><div dir="auto">Biggest obstacle for me was that mesa git require some new llvm, and just released two days ago SPIRV-Tools-2024.4 !</div><div dir="auto"><br></div><div dir="auto">And github "release" is of course broken, in sense you need to manually fetch headers at specific commit.</div><div dir="auto"><br></div><div dir="auto">Of course "real gpu" will get like >200 GFLOPS , even my puny GF710 was that fast, but possibility of lock up makes this option less attractive ;)</div><div dir="auto"><br></div></div></div>