<div dir="ltr"><div>Here it is: <a href="https://gist.github.com/standage/4222de94bd695f23f673">https://gist.github.com/standage/4222de94bd695f23f673</a><br><br></div>Forgot to mention, running khmer 1.1<br><br>Thanks,<br>Daniel<br></div><div class="gmail_extra"><br clear="all"><div><div dir="ltr"><br>--<br>Daniel S. Standage<br>Ph.D. Candidate<br>Computational Genome Science Laboratory<br>Indiana University<br></div></div>
<br><div class="gmail_quote">On Wed, Sep 17, 2014 at 4:31 PM, C. Titus Brown <span dir="ltr">&lt;<a href="mailto:ctb@msu.edu" target="_blank">ctb@msu.edu</a>&gt;</span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">On Wed, Sep 17, 2014 at 04:27:09PM -0400, Daniel Standage wrote:<br>
&gt; Before running norm-by-median, I<br>
&gt;<br>
&gt;    - Downloaded SRA file<br>
&gt;    - Used fastq-dump to create paired Fastq files<br>
&gt;    - used interleave-reads to create a Fastq file in the One True Format<br>
<span class="">&gt;<br>
&gt; All of the Fastq files seem to be fine i.e. none appear truncated. Memory<br>
&gt; usage is remaining constant, CPU utilization is 100%, but the weird thing<br>
&gt; is that as far as I can tell the norm-by-median script is complete. It has<br>
&gt; processed all the input, given a final report, and all of the kept reads<br>
&gt; have been written to output: except the last read is missing and the second<br>
&gt; to last read is cut off.<br>
<br>
</span>Sounds like a classic fencepost error :(.<br>
<br>
Could you send me (on or off the list) the SRA commands you used and<br>
the command line you ran with diginorm?  Then we&#39;ll see if we can replicate<br>
on our own hardware.<br>
<br>
cheers,<br>
<div class="HOEnZb"><div class="h5">--titus<br>
<br>
&gt; On Wed, Sep 17, 2014 at 4:21 PM, C. Titus Brown &lt;<a href="mailto:ctb@msu.edu">ctb@msu.edu</a>&gt; wrote:<br>
&gt;<br>
&gt; &gt; Hi Daniel,<br>
&gt; &gt;<br>
&gt; &gt; sounds like an infinite loop of some sort :(.<br>
&gt; &gt;<br>
&gt; &gt; A few questions --<br>
&gt; &gt;<br>
&gt; &gt; What version of khmer are you using?<br>
&gt; &gt;<br>
&gt; &gt; Have you run the reads file through any other software?  I&#39;m worried<br>
&gt; &gt; that the file is truncated in some way.<br>
&gt; &gt;<br>
&gt; &gt; Do you know how far through your reads file it&#39;s gotten?<br>
&gt; &gt;<br>
&gt; &gt; Is memory usage increasing or remaining constant?<br>
&gt; &gt;<br>
&gt; &gt; thanks,<br>
&gt; &gt; --titus<br>
&gt; &gt;<br>
&gt; &gt; On Wed, Sep 17, 2014 at 04:16:37PM -0400, Daniel Standage wrote:<br>
&gt; &gt; &gt; Hi all,<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; I am seeing some strange behavior running normalize-by-median.py. The<br>
&gt; &gt; &gt; program seemed to complete successfully after 30-45 minutes, but then it<br>
&gt; &gt; &gt; just hung there. It&#39;s now been at least 90 minutes and it&#39;s continuing to<br>
&gt; &gt; &gt; hang. The output file seems to contain all the data except the last<br>
&gt; &gt; record,<br>
&gt; &gt; &gt; and the second-to-last record is cut off.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; (khmer-env)[standage@bggnomic qc] tail SRR494178_int.fastq.keep<br>
&gt; &gt; &gt; +<br>
&gt; &gt; &gt;<br>
&gt; &gt; GBGED&gt;&gt;E##################################################################################<br>
&gt; &gt; &gt; @SRR494178.12090255/1<br>
&gt; &gt; &gt;<br>
&gt; &gt; TCGAGGACNACCTTTTGACCCTTCTGCAACCTTTGAATTTCAGACATCAAACTCTCCCTCTGTCGTGTCTCCNNCAATGATGGGTCGGGC<br>
&gt; &gt; &gt; +<br>
&gt; &gt; &gt;<br>
&gt; &gt; IIIIIGGG#GGGGGGIIIIIIIIIIIIIIIIGIHIIIIIGIIIIIIIIIIIIIHIIIIHIEGHHIFIHII=?##?;9&gt;&gt;;IGBFFGBD8G<br>
&gt; &gt; &gt; @SRR494178.12090255/2<br>
&gt; &gt; &gt;<br>
&gt; &gt; GATTCCGTCACCGAGGAGTATCCGTTGCCGAGGTTGTGCGTCTGTCGAACCTGGCCGTTCTTTTTGACCGTGTAGGTGCCGCCGTTGATC<br>
&gt; &gt; &gt; +<br>
&gt; &gt; &gt; IIIIIIHIIIIIIIIIBIHHIIIGIIIIIII(khmer-env)[standage@bggnomic qc]<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Any ideas as to what could be causing this?<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; Thanks,<br>
&gt; &gt; &gt; Daniel<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; PS.<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;    - OS: Fedora 20 with lots o RAM (100s of GB)<br>
&gt; &gt; &gt;    - Command: normalize-by-median.py -k 17 -p -N 4 -x 8e9<br>
&gt; &gt; &gt;    SRR494178_int.fastq<br>
&gt; &gt; &gt;    - Data: <a href="http://www.ncbi.nlm.nih.gov/sra/?term=SRR494178" target="_blank">http://www.ncbi.nlm.nih.gov/sra/?term=SRR494178</a><br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt;<br>
&gt; &gt; &gt; --<br>
&gt; &gt; &gt; Daniel S. Standage<br>
&gt; &gt; &gt; Ph.D. Candidate<br>
&gt; &gt; &gt; Computational Genome Science Laboratory<br>
&gt; &gt; &gt; Indiana University<br>
&gt; &gt;<br>
&gt; &gt; &gt; _______________________________________________<br>
&gt; &gt; &gt; khmer mailing list<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; C. Titus Brown, <a href="mailto:ctb@msu.edu">ctb@msu.edu</a><br>
&gt; &gt;<br>
<br>
--<br>
C. Titus Brown, <a href="mailto:ctb@msu.edu">ctb@msu.edu</a><br>
</div></div></blockquote></div><br></div>