<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
<meta name="Generator" content="Microsoft Exchange Server">
<!-- converted from text --><style><!-- .EmailQuote { margin-left: 1pt; padding-left: 4pt; border-left: #800000 2px solid; } --></style>
</head>
<body>
<meta content="text/html; charset=UTF-8">
<style type="text/css" style="">
<!--
p
        {margin-top:0;
        margin-bottom:0}
-->
</style>
<div dir="ltr">
<div id="x_divtagdefaultwrapper" dir="ltr" style="font-size:12pt; color:#000000; font-family:Calibri,Helvetica,sans-serif">
<p>Hi Martin,</p>
<p><br>
</p>
<p>It seems like I have deleted the files for this run.</p>
<p>But I have attached files for another run that died for perhaps a different reason.</p>
<p><br>
</p>
<p>Thanks</p>
<p><br>
</p>
<p>Yangxin</p>
</div>
<hr tabindex="-1" style="display:inline-block; width:98%">
<div id="x_divRplyFwdMsg" dir="ltr"><font face="Calibri, sans-serif" color="#000000" style="font-size:11pt"><b>From:</b> MITgcm-support <mitgcm-support-bounces@mitgcm.org> on behalf of Martin Losch <Martin.Losch@awi.de><br>
<b>Sent:</b> Wednesday, March 25, 2020 3:43:54 PM<br>
<b>To:</b> MITgcm Support<br>
<b>Subject:</b> Re: [MITgcm-support] jobs died suddenly</font>
<div> </div>
</div>
</div>
<font size="2"><span style="font-size:10pt;">
<div class="PlainText">Hi Yangxin,<br>
<br>
something is happening in S/R MDS_READ_SEC_YZ (in pkg/mdsio/mdsio_read_section.F)<br>
The error message can have at least 5 different reasons, but we cannot know which, because you didn’t provide that infromation (probably somewhere in STDOUT.* or STDERR.*).<br>
<br>
Martin<br>
<br>
> On 25. Mar 2020, at 20:24, Yangxin He <y67he@uwaterloo.ca> wrote:<br>
> <br>
> Hello there,<br>
> <br>
> Recently several jobs of mine died of no reason. The error message is<br>
> [y67he@gra-login1 b6]$ more sim-29315632.err <br>
> ABNORMAL END: S/R MDS_READ_SEC_YZ<br>
> srun: Job step aborted: Waiting up to 62 seconds for job step to finish.<br>
> slurmstepd: error: *** JOB 29315632 ON gra228 CANCELLED AT 2020-03-25T08:30:08 DUE TO TIME LIMIT ***<br>
> slurmstepd: error: *** STEP 29315632.0 ON gra228 CANCELLED AT 2020-03-25T08:30:08 DUE TO TIME LIMIT ***<br>
> The time limit was not the problem. The code simply stopped producing any new results, however, it was still running.<br>
> This is confusing, because I have been using the same set up for a while and this only started to happen in the past few weeks.<br>
> <br>
> I ran my code on graham in compute Canada, and the people there suggested it may be the problem in the code.<br>
> Can anyone shed any lights on this?<br>
> <br>
> Thanks<br>
> <br>
> Yangxin<br>
> _______________________________________________<br>
> MITgcm-support mailing list<br>
> MITgcm-support@mitgcm.org<br>
> <a href="http://mailman.mitgcm.org/mailman/listinfo/mitgcm-support">http://mailman.mitgcm.org/mailman/listinfo/mitgcm-support</a><br>
<br>
_______________________________________________<br>
MITgcm-support mailing list<br>
MITgcm-support@mitgcm.org<br>
<a href="http://mailman.mitgcm.org/mailman/listinfo/mitgcm-support">http://mailman.mitgcm.org/mailman/listinfo/mitgcm-support</a><br>
</div>
</span></font>
</body>
</html>