<div dir="ltr">Thanks Titus,<div><br><div class="gmail_extra"><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div class="im">
&gt; Does the counting hash have a built-in way to enumerate used hash table<br>
&gt; entries without having to iterate over every hash table entry?<br>
<br>
</div>Err, no :).  Are you using ktable or counting hash?  If the latter then you<br>
absolutely need to keep an explicit list of query k-mers.<br>
<div class="im"><br>
&gt; On a slightly related note, if I have 16GB of memory to work with, is it<br>
&gt; advisable to choose hash_size = min(4**k, 16e9)/4 and n_tables = 4 when<br>
&gt; calling new_counting_hash for k-mer counting?<br>
<br></div></blockquote><div style>If I wanted to minimize the amount of memory used when k is small (i.e., when 4**k bytes is much smaller than 16GB), would setting <span style="color:rgb(80,0,80)">hash_size = 4**(k-1) and n_tables = 4 or</span></div>
<div style><span style="color:rgb(80,0,80)">hash_size = 4**k and n_tables = 1 be sufficient for a small false positive rate?</span><span style="color:rgb(80,0,80)"><br></span></div><div style><br></div><div style>Thanks,</div>
<div style>Lester</div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left-width:1px;border-left-color:rgb(204,204,204);border-left-style:solid;padding-left:1ex">
<div class=""><div class="h5"><br>
&gt;  &gt; &gt;<br>
&gt; &gt; &gt; &gt; On Fri, Jun 14, 2013 at 3:22 AM, Lester Mackey &lt;<a href="mailto:lmackey@stanford.edu">lmackey@stanford.edu</a><br>
&gt; &gt; &gt;wrote:<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt;&gt; Dear khmer Discussion List,<br>
&gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt;&gt; If my goal is to obtain a vector of kmer counts quickly from a FASTA<br>
&gt; &gt; or<br>
&gt; &gt; &gt; &gt;&gt; FASTQ file, is there any reason to prefer ktable to one of your other<br>
&gt; &gt; data<br>
&gt; &gt; &gt; &gt;&gt; structures, like the counting hash table?<br>
&gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt; &gt; &gt;&gt; I&#39;ve noticed that ktable hashes a kmer and its reverse complement to<br>
&gt; &gt; the<br>
&gt; &gt; &gt; &gt;&gt; same bin.  Is there an easy way to disable this feature (and thereby<br>
&gt; &gt; count<br>
&gt; &gt; &gt; &gt;&gt; each kmer and reverse complement separately)?<br>
&gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt;&gt; Thanks,<br>
&gt; &gt; &gt; &gt;&gt; Lester<br>
&gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt;&gt; _______________________________________________<br>
&gt; &gt; &gt; &gt;&gt; khmer mailing list<br>
&gt; &gt; &gt; &gt;&gt; <a href="mailto:khmer@lists.idyll.org">khmer@lists.idyll.org</a><br>
&gt; &gt; &gt; &gt;&gt; <a href="http://lists.idyll.org/listinfo/khmer" target="_blank">http://lists.idyll.org/listinfo/khmer</a><br>
&gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt;&gt;<br>
&gt; &gt; &gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; &gt; _______________________________________________<br>
&gt; &gt; &gt; khmer mailing list<br>
&gt; &gt; &gt; <a href="mailto:khmer@lists.idyll.org">khmer@lists.idyll.org</a><br>
&gt; &gt; &gt; <a href="http://lists.idyll.org/listinfo/khmer" target="_blank">http://lists.idyll.org/listinfo/khmer</a><br>
&gt; &gt;<br>
&gt; &gt;<br>
&gt; &gt; --<br>
&gt; &gt; C. Titus Brown, <a href="mailto:ctb@msu.edu">ctb@msu.edu</a><br>
&gt; &gt;<br>
<br>
--<br>
C. Titus Brown, <a href="mailto:ctb@msu.edu">ctb@msu.edu</a><br>
</div></div></blockquote></div><br></div></div></div>