<div dir="ltr">Hey Christoph, <div><br></div><div>I'm sure you'll get better and more thorough answers from other people here, but I thought I'd say that I did some tests on how the MITgcm scales and compiled the attached data, I'm not sure if the image will show up or not. Essentially there was a falloff in performance gain past 128-256 cores. On the cluster we run on you can request full nodes or let the processes distribute across many nodes, and we found that it ran faster distributed across many nodes as it had access to memory which was unused by other processes. </div><div><div><img src="cid:ii_jua4epu80" alt="image.png" width="327" height="202" style="margin-right: 0px;"><br></div><div><div><img src="cid:ii_jua4inga1" alt="image.png" width="456" height="160" style="margin-right: 0px;"><br></div></div><div>Profiling the code showed that memory bandwidth is still a restriction. </div><div><br></div><div>As for the other questions, I have no idea, but hopefully this information can help. </div><div><br></div>Regards,<br><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature">Senja</div></div></div>