<div dir="ltr"><div>Before running norm-by-median, I<br><ul><li>Downloaded SRA file</li><li>Used fastq-dump to create paired Fastq files</li><li>used interleave-reads to create a Fastq file in the One True Format</li></ul></div>All of the Fastq files seem to be fine i.e. none appear truncated. Memory usage is remaining constant, CPU utilization is 100%, but the weird thing is that as far as I can tell the norm-by-median script is complete. It has processed all the input, given a final report, and all of the kept reads have been written to output: except the last read is missing and the second to last read is cut off.<br></div><div class="gmail_extra"><br clear="all"><div><div dir="ltr"><br>--<br>Daniel S. Standage<br>Ph.D. Candidate<br>Computational Genome Science Laboratory<br>Indiana University<br></div></div>
<br><div class="gmail_quote">On Wed, Sep 17, 2014 at 4:21 PM, C. Titus Brown <span dir="ltr">&lt;<a href="mailto:ctb@msu.edu" target="_blank">ctb@msu.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Daniel,<br>
<br>
sounds like an infinite loop of some sort :(.<br>
<br>
A few questions --<br>
<br>
What version of khmer are you using?<br>
<br>
Have you run the reads file through any other software?  I&#39;m worried<br>
that the file is truncated in some way.<br>
<br>
Do you know how far through your reads file it&#39;s gotten?<br>
<br>
Is memory usage increasing or remaining constant?<br>
<br>
thanks,<br>
--titus<br>
<span class=""><br>
On Wed, Sep 17, 2014 at 04:16:37PM -0400, Daniel Standage wrote:<br>
&gt; Hi all,<br>
&gt;<br>
&gt; I am seeing some strange behavior running normalize-by-median.py. The<br>
&gt; program seemed to complete successfully after 30-45 minutes, but then it<br>
&gt; just hung there. It&#39;s now been at least 90 minutes and it&#39;s continuing to<br>
&gt; hang. The output file seems to contain all the data except the last record,<br>
&gt; and the second-to-last record is cut off.<br>
&gt;<br>
&gt; (khmer-env)[standage@bggnomic qc] tail SRR494178_int.fastq.keep<br>
&gt; +<br>
&gt; GBGED&gt;&gt;E##################################################################################<br>
&gt; @SRR494178.12090255/1<br>
&gt; TCGAGGACNACCTTTTGACCCTTCTGCAACCTTTGAATTTCAGACATCAAACTCTCCCTCTGTCGTGTCTCCNNCAATGATGGGTCGGGC<br>
&gt; +<br>
&gt; IIIIIGGG#GGGGGGIIIIIIIIIIIIIIIIGIHIIIIIGIIIIIIIIIIIIIHIIIIHIEGHHIFIHII=?##?;9&gt;&gt;;IGBFFGBD8G<br>
&gt; @SRR494178.12090255/2<br>
&gt; GATTCCGTCACCGAGGAGTATCCGTTGCCGAGGTTGTGCGTCTGTCGAACCTGGCCGTTCTTTTTGACCGTGTAGGTGCCGCCGTTGATC<br>
&gt; +<br>
&gt; IIIIIIHIIIIIIIIIBIHHIIIGIIIIIII(khmer-env)[standage@bggnomic qc]<br>
&gt;<br>
&gt; Any ideas as to what could be causing this?<br>
&gt;<br>
&gt; Thanks,<br>
&gt; Daniel<br>
&gt;<br>
&gt; PS.<br>
&gt;<br>
</span>&gt;    - OS: Fedora 20 with lots o RAM (100s of GB)<br>
&gt;    - Command: normalize-by-median.py -k 17 -p -N 4 -x 8e9<br>
&gt;    SRR494178_int.fastq<br>
&gt;    - Data: <a href="http://www.ncbi.nlm.nih.gov/sra/?term=SRR494178" target="_blank">http://www.ncbi.nlm.nih.gov/sra/?term=SRR494178</a><br>
<span class="">&gt;<br>
&gt;<br>
&gt; --<br>
&gt; Daniel S. Standage<br>
&gt; Ph.D. Candidate<br>
&gt; Computational Genome Science Laboratory<br>
&gt; Indiana University<br>
<br>
</span>&gt; _______________________________________________<br>
&gt; khmer mailing list<br>
<span class="HOEnZb"><font color="#888888"><br>
--<br>
C. Titus Brown, <a href="mailto:ctb@msu.edu">ctb@msu.edu</a><br>
</font></span></blockquote></div><br></div>