<html><head>
<meta content="text/html; charset=ISO-8859-1" http-equiv="Content-Type">
</head><body bgcolor="#FFFFFF" text="#000000"><span style="font-family: 
Times New Roman,Times,serif;">Hi Erich,</span><br style="font-family: 
Times New Roman,Times,serif;">
<br style="font-family: Times New Roman,Times,serif;">
<span style="font-family: Times New Roman,Times,serif;">I guess this is 
supposed to happen, and actually won't just be a prob. for khmer, but 
other tools as well (e.g. bowtie, samtools I think). I strongly 
recommend formatting your headers either with a trailing -1, -2 or /1, 
/2 (no spaces!;</span><br style="font-family: Times New 
Roman,Times,serif;">
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
<pre style="font-family: Times New Roman,Times,serif;" wrap="">DHKW5DQ1:285:D1T8EACXX:7:1101:1397:2177-1
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1"><pre wrap="">DHKW5DQ1:285:D1T8EACXX:7:1101:1397:2177/1</pre></pre>
<span style="font-family: Times New Roman,Times,serif;">) from the 
beginning and always stick to this rule.</span><br style="font-family: 
Times New Roman,Times,serif;">
<span style="font-family: Times New Roman,Times,serif;">A simple perl 
oneliner will help.<br>
  <br>
Cheers<br>
  <br>
Philipp<br>
</span>&nbsp;<br>
<br>
<blockquote style="border: 0px none;" 
cite="mid:209E0C39-BD3C-46C1-AEB3-ED5FF13F970F@cornell.edu" type="cite">
  <div style="margin:30px 25px 10px 25px;" class="__pbConvHr"><div 
style="display:table;width:100%;border-top:1px solid 
#EDEEF0;padding-top:5px">         <div 
style="display:table-cell;vertical-align:middle;padding-right:6px;"><img
 photoaddress="ems394@cornell.edu" photoname="Erich Marquard Schwarz" 
src="cid:part1.05020308.04020908@googlemail.com" 
name="compose-unknown-contact.jpg" height="25px" width="25px"></div>   <div
 
style="display:table-cell;white-space:nowrap;vertical-align:middle;width:100%">
           <a moz-do-not-send="true" href="mailto:ems394@cornell.edu" 
style="color:#737F92 
!important;padding-right:6px;font-weight:bold;text-decoration:none 
!important;">Erich Marquard Schwarz</a></div>   <div 
style="display:table-cell;white-space:nowrap;vertical-align:middle;">   
  <font color="#9FA2A5"><span style="padding-left:6px">17 July 2014 
18:19</span></font></div></div></div>
  <div style="color:#888888;margin-left:24px;margin-right:24px;" 
__pbrmquotes="true" class="__pbConvBody"><div>Hi all,<br><br>I used 
khmer to begin normalizing RNA-seq data with this command:<br><br>    
normalize-by-median.py -k 20 -C 20 -x 2e9 -N 4 --savehash 
Csp1_rna_2014.07.16.filt.jumbled.kh Csp1_rna_2014.07.16.filt.jumbled.fa ;<br><br>which
 produced Csp1_rna_2014.07.16.filt.jumbled.fa.keep.<br><br>Unfortunately,
 I was not aware that khmer has the nasty side effect of stripping 
header information.  Here are two header texts -- the first from 
Csp1_rna_2014.07.16.filt.jumbled.fa, the second from its khmer product 
Csp1_rna_2014.07.16.filt.jumbled.fa.keep:<br><br>    
&gt;DHKW5DQ1:285:D1T8EACXX:7:1101:1397:2177 1:N:0:TATGTGGC<br><br>    
&gt;DHKW5DQ1:285:D1T8EACXX:7:1101:1397:2177<br><br>The first header line
 has paired-end information using Illumina's new format (with trailing '
 1' and ' 2' -- which I agree is less robust than the old-style '#1' and
 '#2' suffixes that Illumina used to use, but Illumina is the 800-pound 
gorilla here, and we are its mere servant chimps).<br><br>That 
header-stripping 'feature' of khmer totally trashed my later work on the
 data.  I will have to retroname the reads (give them "#1' and "#2' 
old-style suffixes) so that I can get khmer to work with them without 
wrecking their usability for later re-sorting and subsequent uses (in 
this case, genome RNA-scaffolding).<br><br>Lost time, roughly one day.<br><br>The
 version I have of khmer was installed on 9/4/2012.  If this side-effect
 has been fixed since then, that's good news; if not, then it'd be good 
if it *were* fixed.<br><br>Thank you,<br><br><br>--Erich<br><br><br><br>_______________________________________________<br>khmer
 mailing list<br><a class="moz-txt-link-abbreviated" href="mailto:khmer@lists.idyll.org">khmer@lists.idyll.org</a><br><a class="moz-txt-link-freetext" href="http://lists.idyll.org/listinfo/khmer">http://lists.idyll.org/listinfo/khmer</a><br></div></div>
</blockquote>
</body></html>