<div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div dir="ltr"><div class="gmail_default" style="font-size:small">This is an amalgamation of email from Pierre / me that should have been in the mailing list but I missed seeing that.</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small"><b><u>Summary first</u></b> in case you don't want to read it all.  And just FYI, Pierre tests on Mint18 and I use Fedora29 with totally different processors, number of CPUs and even brand of graphics boards.<br></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">1) Pierre: I don't really see any gains either with X11 or X11-OpenGL, the viewing in the composer may be a little more fluid but I'm not sure ... shouldn't vdpau be able to decode these mpeg?</div><div class="gmail_default" style="font-size:small"> 2) Phyllis: When you use X11-OpenGL, which was written long ago when there was mostly only 1 CPU so only 1 thread, the computer to the Graphics board can become bottlenecked with Cinelerra calling for OpenGL graphics and at the same time the GPU being used with vdpau (can not confirm that this is happening).</div><div class="gmail_default" style="font-size:small">3) Pierre: I don't have the feeling that the GPU decodes video tracks under X11-OpenGL even in the case of mpeg proxies.</div><div class="gmail_default" style="font-size:small">4) Phyllis: with certain hardware, I think you might be correct about GPU not doing the decoding under X11-OpenGL, but I can not find anything that corroborates that.  I do see that with "loglevel=verbose" a vdpau device is created in either the X11 or the OpenGL driver case.  But I am finding CPU usage is actually higher with the X11-OpenGL driver PLUS vdapu than X11-OpenGL MINUS vdpau with my computer hardware.</div><div class="gmail_default" style="font-size:small">5) Phyllis: on computers with lots of CPU cores it does not seem worthwhile to bother with using the graphics board GPU for decoding.  And that might apply to encoding too in the case of the final render because using the Render Farm (on a single computer with lots of cores) is pretty fast.</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small"><b><u>Pierre's Tests Results</u></b> (Intel computer with Nvidia graphics board)<b><u><br></u></b></div><div class="gmail_default" style="font-size:small">"DNxHD corrected.xml Test" file<br>X11-OpenGL driver<br>command CIN_HW_DEV=vdpau ./cin<br><br>Proxys mpeg<br>cpu % 21.6 - 43.7<br>frame/sec 11.18 - 12.16<br><br>DNxHD media<br>cpu % 13.4 - 44.8<br>frame/sec 11.54 - 12.16<br><br><br>"DNxHD corrected.xml Test" file<br>X11-OpenGL driver<br>order /home/stone/Cinelerra-GG_5.1/cin<br><br>Proxys mpeg<br>cpu % 19.1 - 44.3<br>frame/sec 11.39 - 12.24<br><br>DNxHD media<br>cpu % 19.6 - 44.5<br>frame/sec 11.32 - 12.16<br><br><br>"DNxHD corrected.xml Test" file<br>X11 Pilot<br>command CIN_HW_DEV=vdpau ./cin<br><br>Proxys mpeg<br>cpu % 19.5 - 41.7<br>frame/sec 29.97 - 30.15<br><br>DNxHD media<br>cpu % 22.9 - 40.3<br>frame/sec 28.24 - 31.15<br></div><div class="gmail_default" style="font-size:small">"DNxHD corrected.xml Test" file<br>X11 Pilot<br>order /home/stone/Cinelerra-GG_5.1/cin<br><br>Proxys mpeg<br>cpu % 23.08 - 42.4<br>frame/sec 29.97 - 31.02<br><br>DNxHD media<br>cpu % 21.7 - 43.5<br>frame/sec 29.97 - 31.02<br><br><br>Interesting....<br><br>At first glance, I would say that:<br><br>X11-OpenGL with or without vdpau<br><br>Does not decode DNxHD sources<br><br>Do not decode Proxys mpeg<br><br>x11 with or without vdpau<br><br>Decodes DNxHD sources<br><br>Decode mpeg proxies<br><br><br>I think I will now have to do some identical tests with HDV and H264.mp4 sources.<br></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small"><b>Short Phyllis tests (</b>AMD computer, Radeon graphics board)<br></div><div class="gmail_default" style="font-size:small"> using the proxy Mpeg version, I see:<br>  11% cpu usage with X11-OpenGL<br>  13% cpu usage with X11-OpenGL + vdpau/GPU<br>  16% cpu usage with X11 + vdpau/GPU<br>  21% cpu usage with X11</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small"><u><b>Most of the rest of the email thread is below.</b></u></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">Pierre Observation:<br><br>I don't really see any gains either with X11 or X11-OpenGL, the viewing in the composer may be a lit<br>tle more fluid but I'm not sure.<br><br>I'm surprised that X11-OpenGL can't be fluid with mpeg.mpeg proxies,<br>while it's much more fluid with Clowns' h264.mpeg and X11 does it all<br>much better.<br><br>But, as it is the mpeg.mpeg proxies that I actually use, shouldn't vdpau<br>be able to decode these mpeg?<br><br>Phyllis some response: <br><br>So I had 4 dnxhd files from previous reports and I proxied them as 1/2 mpeg-s.  Although it is not o<br>bvious that they are using vdpau, they actually are.  Bill reminded me to edit ffmpeg/decode.opts an<br>d change "loglevel=fatal" to "loglevel=verbose", restart Cinelerra and then in the cinelerra startup<br> window you will see messages for the Mpegs:     (you might have to also edit bin/ffmpeg/decode.opts<br>)<br><br>[AVHWDeviceContext @ 0x7fff182c3cc0] Successfully created a VDPAU device (G3DVL VDPAU Driver Shared <br>Library version 1.0) on X11 display :0<br>[AVHWDeviceContext @ 0x7ffea8afc980] Successfully created a VDPAU device (G3DVL VDPAU Driver Shared <br>Library version 1.0) on X11 display :0<br>[AVHWDeviceContext @ 0x7fff6c1b12c0] Successfully created a VDPAU device (G3DVL VDPAU Driver Shared <br>Library version 1.0) on X11 display :0<br>[AVHWDeviceContext @ 0x7fff6f223300] Successfully created a VDPAU device (G3DVL VDPAU Driver Shared <br>Library version 1.0) on X11 display :0<br><br>When you use X11-OpenGL, which was written long ago when there was mostly only 1 CPU so only 1 threa<br>d, the computer to the Graphics board can become bottlenecked with Cinelerra calling for OpenGL grap<br>hics and at the same time the GPU being used with vdpau.<br>----------------------------------------------------------------------------------------------<br><br>Pierre Observation:<br><br>What surprises me though is that this difficulty does not exist under<br>X11; the accumulation of video tracks from mixers does not cause the<br>composer to slow down under this video driver.When I play DNxHD sources the CPU usage is 37-41%,<br>If I play proxies in mpeg, the CPU usage is 10-18%.<br>But in both cases (DNxHD and proxies in mpeg), the frame rate (in<br>CinGG's preferences) is 11-12 frame/s (whereas the normal rate should be<br>29.97 frame/s).<br><br>Phyllis some response: <br><br>When I play it, X11-OpenGL slows down so that the mixers are done playing and compositor is only on <br>frame 106; but with X11 I still have slow down, just not as bad.  The mixers are done playing but th<br>e compositor is still playing at about frame 175 - so for me X11 does still have the difficulty.<br><br>I suspect that your computer is faster with more cores.  For example, with X11-OpenGL, if I run the <br>"top" command from another window and watch it, I see it goes to 489% so is using threads/multiple c<br>ores BUT it must be waiting on the single threaded Graphics Board.  Since when I just use X11, the p<br>rogram is not waiting on the graphics boards and runs at 600%.  The graphics board is likely a bottl<br>eneck.<br>---------------------------------------------------------------------------------------------------<br><br>Pierre Observation:<br><br>Under the X11 video driver:<br>With DNxHD, the CPU is at 35% and the frame rate at 29.97-30 frame/s<br>With Proxys in mpeg, the CPU is at 6.5-10.9% and the frame rate is also<br>at 29.97-30 frame/s.<br><br>I don't have the feeling that the GPU decodes video tracks under<br>X11-OpenGL even in the case of mpeg proxies.<br> <br>    Secondly,<br><br>    Under the X11-OpenGL video driver:<br>    When I play DNxHD sources the CPU usage is 37-41%,<br>    If I play proxies in mpeg, the CPU usage is 10-18%.<br>    But in both cases (DNxHD and proxies in mpeg), the frame rate (in<br>    CinGG's preferences) is 11-12 frame/s (whereas the normal rate should be<br>    29.97 frame/s).<br><br>Phyllis some response:<br><br>Unfortunately, I am not seeing this.  For example with:<br>     EX-EGO Test DNxHD/Cam-4_MVI_1321_EX-EGO_cam-D.mov<br>I see 29.97 fps in preferences and 60% CPU<br>     EX-EGO Test DNxHD/Cam-4_MVI_1321_EX-EGO_cam-D.proxy2-mov.mpeg<br>and here I see 29.97 fps and 70% CPU<br><br>Something else must be causing the problem you see.  GG noticed that these DNxHD sources are very large in size but I do not think that the disk I/O would slow anything down.<br><br>I think you might be correct about GPU not doing the decoding under X11-OpenGL, but I can not find anything that corroborates that.  I do see that with "loglevel=verbose" a vdpau device is created in either the X11 or the OpenGL driver case.  But I am finding CPU usage is actually higher with the X11-OpenGL driver PLUS vdapu than X11-OpenGL MINUS vdpau.  So I thought it was a really bad idea to use OpenGL and GPU/vdpau together.<br><br>However, Sam and Andrea thought they got better results using X11-OpenGL than X11 with vdpau enabled.  This has been mystifying to me as I definitely only saw good improvements using X11.  Since we can not figure it out, I have decided that it might be due to the actual Graphics Card being used in conjunction with the Nvidia driver and operating system.<br><br>Summary - on computers with lots of CPU cores it does not seem worthwhile to bother with using the graphics board GPU for decoding.  And that probably applies to encoding too in the case of the final render because using the Render Farm (on a single computer with an Epyc chip) is so fast as to be trivial.<br>------------------------------------------------------------------------------------------------------------<br><br>Pierre tests on the following:<br><br>The processor of my computer is an i7-3770k, so it has 4 physical core,<br>8 threads by Hyper-Threading (2 processing threads per physical core) at<br>3.50 GHz (turbo 3.90 GHz). 32 GB of ram and an nVidia GTX-750ti<br>extension video card.<br><br>The nVidia card, which is a few years old, is not very powerful for aespecially useful to me because of its ability to manage 4 monitors<br>1920x1080 simultaneously. In my case, it is connected to three monitors.<br><br>I therefore suspect that this video card does not offer a significantly<br>greater performance gain than the possibilities of my CPU...<br><br>Phyllis tests on the following:<br><br> AMD 8-Core RYZEN 7 1700 Processor, 3.0 GHz<br>  cache size      : 512 KB<br>  memory          : 64 GB<br> Radeon Graphics Board  : Radeon RX580 4GB<br><br>gamer type card (the really powerful models have become extremely<br>expensive since the arrival of bitcoin mining...). This video card is<br><br><br></div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small"><br></div></div></div></div></div></div></div></div></div></div></div></div></div></div></div>