<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">

<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
 /* Font Definitions */
 @font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
 /* Style Definitions */
 p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
.MsoChpDefault
        {mso-style-type:export-only;}
@page Section1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
        {page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
 <o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
 <o:shapelayout v:ext="edit">
  <o:idmap v:ext="edit" data="1" />
 </o:shapelayout></xml><![endif]-->
</head>

<body lang=EN-US link=blue vlink=purple>

<div class=Section1>

<p class=MsoNormal>I&#8217;m having some trouble getting the database to
recognize movies/shows that are the same as actually being the same. This
problem is occurring with the database loading module that Titus gave us. For example,
while looking at the database for a good pair of actors to test, I noticed that
Austin, Tony (II) and Banner, David (I) were both in Def Jam Fight for NY. However,
the db loading script is importing the string &#8216;Def Jam Fight for NY
(2004) (VG)&nbsp; (voice)&nbsp; [Teck]&nbsp; &lt;73&gt;&#8217;&nbsp; for
Austin, Tony (II) and the separate string &#8216;Def Jam Fight for NY (2004)
(VG)&nbsp; (voice)&nbsp; [Himself]&nbsp; &lt;23&gt;&#8217; for Banner, David
(I). Since the strings aren&#8217;t the same, the database assigns different
movie_id&#8217;s to them, causing my intersecting searches to turn up nothing.<o:p></o:p></p>

<p class=MsoNormal>Should we do some extra processing to remove all the
information after the title? I can imagine doing a split by &#8216;(&#8216; and
then taking the [0] entry, but what if a movie has &#8216;(&#8216; in it&#8217;s
title?<o:p></o:p></p>

<p class=MsoNormal><o:p>&nbsp;</o:p></p>

<p class=MsoNormal>Thanks,<o:p></o:p></p>

<p class=MsoNormal>Alex<o:p></o:p></p>

</div>

</body>

</html>