|            Branch data     Line data    Source code 
       1                 :            : /* brass_alltermslist.cc: A termlist containing all terms in a brass database.
       2                 :            :  *
       3                 :            :  * Copyright (C) 2005,2007,2008,2009,2010 Olly Betts
       4                 :            :  *
       5                 :            :  * This program is free software; you can redistribute it and/or
       6                 :            :  * modify it under the terms of the GNU General Public License as
       7                 :            :  * published by the Free Software Foundation; either version 2 of the
       8                 :            :  * License, or (at your option) any later version.
       9                 :            :  *
      10                 :            :  * This program is distributed in the hope that it will be useful,
      11                 :            :  * but WITHOUT ANY WARRANTY; without even the implied warranty of
      12                 :            :  * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
      13                 :            :  * GNU General Public License for more details.
      14                 :            :  *
      15                 :            :  * You should have received a copy of the GNU General Public License
      16                 :            :  * along with this program; if not, write to the Free Software
      17                 :            :  * Foundation, Inc., 51 Franklin St, Fifth Floor, Boston, MA  02110-1301
      18                 :            :  * USA
      19                 :            :  */
      20                 :            : 
      21                 :            : #include <config.h>
      22                 :            : 
      23                 :            : #include "brass_alltermslist.h"
      24                 :            : #include "brass_postlist.h"
      25                 :            : 
      26                 :            : #include "debuglog.h"
      27                 :            : #include "pack.h"
      28                 :            : #include "stringutils.h"
      29                 :            : 
      30                 :            : void
      31                 :        996 : BrassAllTermsList::read_termfreq_and_collfreq() const
      32                 :            : {
      33                 :            :     LOGCALL_VOID(DB, "BrassAllTermsList::read_termfreq_and_collfreq", NO_ARGS);
      34                 :            :     Assert(!current_term.empty());
      35                 :            :     Assert(!at_end());
      36                 :            : 
      37                 :            :     // Unpack the termfreq and collfreq from the tag.  Only do this if
      38                 :            :     // one or other is actually read.
      39                 :        996 :     cursor->read_tag();
      40                 :        996 :     const char *p = cursor->current_tag.data();
      41                 :        996 :     const char *pend = p + cursor->current_tag.size();
      42                 :        996 :     BrassPostList::read_number_of_entries(&p, pend, &termfreq, &collfreq);
      43                 :        996 : }
      44                 :            : 
      45                 :        223 : BrassAllTermsList::~BrassAllTermsList()
      46                 :            : {
      47                 :            :     LOGCALL_DTOR(DB, "BrassAllTermsList");
      48 [ +  - ][ #  # ]:        223 :     delete cursor;
                 [ #  # ]
      49 [ +  - ][ #  # ]:        223 : }
                 [ #  # ]
      50                 :            : 
      51                 :            : string
      52                 :      16809 : BrassAllTermsList::get_termname() const
      53                 :            : {
      54                 :            :     LOGCALL(DB, string, "BrassAllTermsList::get_termname", NO_ARGS);
      55                 :            :     Assert(!current_term.empty());
      56                 :            :     Assert(!at_end());
      57                 :      16809 :     RETURN(current_term);
      58                 :            : }
      59                 :            : 
      60                 :            : Xapian::doccount
      61                 :        996 : BrassAllTermsList::get_termfreq() const
      62                 :            : {
      63                 :            :     LOGCALL(DB, Xapian::doccount, "BrassAllTermsList::get_termfreq", NO_ARGS);
      64                 :            :     Assert(!current_term.empty());
      65                 :            :     Assert(!at_end());
      66         [ +  - ]:        996 :     if (termfreq == 0) read_termfreq_and_collfreq();
      67                 :        996 :     RETURN(termfreq);
      68                 :            : }
      69                 :            : 
      70                 :            : Xapian::termcount
      71                 :          0 : BrassAllTermsList::get_collection_freq() const
      72                 :            : {
      73                 :            :     LOGCALL(DB, Xapian::termcount, "BrassAllTermsList::get_collection_freq", NO_ARGS);
      74                 :            :     Assert(!current_term.empty());
      75                 :            :     Assert(!at_end());
      76         [ #  # ]:          0 :     if (termfreq == 0) read_termfreq_and_collfreq();
      77                 :          0 :     RETURN(collfreq);
      78                 :            : }
      79                 :            : 
      80                 :            : TermList *
      81                 :       1393 : BrassAllTermsList::next()
      82                 :            : {
      83                 :            :     LOGCALL(DB, TermList *, "BrassAllTermsList::next", NO_ARGS);
      84                 :            :     Assert(!at_end());
      85                 :            :     // Set termfreq to 0 to indicate no termfreq/collfreq have been read for
      86                 :            :     // the current term.
      87                 :       1393 :     termfreq = 0;
      88                 :            : 
      89         [ +  + ]:       1393 :     if (rare(!cursor)) {
      90                 :        223 :         cursor = database->postlist_table.cursor_get();
      91                 :            :         Assert(cursor); // The postlist table isn't optional.
      92                 :            : 
      93         [ +  + ]:        223 :         if (prefix.empty()) {
      94                 :        138 :             (void)cursor->find_entry_ge(string("\x00\xff", 2));
      95                 :            :         } else {
      96                 :         85 :             const string & key = pack_brass_postlist_key(prefix);
      97         [ +  + ]:         85 :             if (cursor->find_entry_ge(key)) {
      98                 :            :                 // The exact term we asked for is there, so just copy it rather
      99                 :            :                 // than wasting effort unpacking it from the key.
     100                 :          5 :                 current_term = prefix;
     101                 :         82 :                 RETURN(NULL);
     102         [ +  + ]:         85 :             }
     103                 :            :         }
     104                 :        215 :         goto first_time;
     105                 :            :     }
     106                 :            : 
     107                 :        196 :     while (true) {
     108                 :       1366 :         cursor->next();
     109                 :            : first_time:
     110         [ +  + ]:       1581 :         if (cursor->after_end()) {
     111                 :        150 :             current_term.resize(0);
     112                 :        150 :             RETURN(NULL);
     113                 :            :         }
     114                 :            : 
     115                 :       1431 :         const char *p = cursor->current_key.data();
     116                 :       1431 :         const char *pend = p + cursor->current_key.size();
     117         [ -  + ]:       1431 :         if (!unpack_string_preserving_sort(&p, pend, current_term)) {
     118                 :          0 :             throw Xapian::DatabaseCorruptError("PostList table key has unexpected format");
     119                 :            :         }
     120                 :            : 
     121                 :            :         // If this key is for the first chunk of a postlist, we're done.
     122                 :            :         // Otherwise we need to skip past continuation chunks until we find the
     123                 :            :         // first chunk of the next postlist.
     124         [ +  + ]:       1431 :         if (p == pend) break;
     125                 :            :     }
     126                 :            : 
     127         [ +  + ]:       1235 :     if (!startswith(current_term, prefix)) {
     128                 :            :         // We've reached the end of the prefixed terms.
     129                 :         59 :         cursor->to_end();
     130                 :         59 :         current_term.resize(0);
     131                 :            :     }
     132                 :            : 
     133                 :       1390 :     RETURN(NULL);
     134                 :            : }
     135                 :            : 
     136                 :            : TermList *
     137                 :         17 : BrassAllTermsList::skip_to(const string &term)
     138                 :            : {
     139                 :            :     LOGCALL(DB, TermList *, "BrassAllTermsList::skip_to", term);
     140                 :            :     Assert(!at_end());
     141                 :            :     // Set termfreq to 0 to indicate no termfreq/collfreq have been read for
     142                 :            :     // the current term.
     143                 :         17 :     termfreq = 0;
     144                 :            : 
     145         [ -  + ]:         17 :     if (rare(!cursor)) {
     146                 :          0 :         cursor = database->postlist_table.cursor_get();
     147                 :            :         Assert(cursor); // The postlist table isn't optional.
     148                 :            :     }
     149                 :            : 
     150                 :         17 :     string key = pack_brass_postlist_key(term);
     151         [ +  + ]:         17 :     if (cursor->find_entry_ge(key)) {
     152                 :            :         // The exact term we asked for is there, so just copy it rather than
     153                 :            :         // wasting effort unpacking it from the key.
     154                 :         11 :         current_term = term;
     155                 :            :     } else {
     156         [ +  - ]:          6 :         if (cursor->after_end()) {
     157                 :          6 :             current_term.resize(0);
     158                 :          6 :             RETURN(NULL);
     159                 :            :         }
     160                 :            : 
     161                 :          0 :         const char *p = cursor->current_key.data();
     162                 :          0 :         const char *pend = p + cursor->current_key.size();
     163         [ #  # ]:          0 :         if (!unpack_string_preserving_sort(&p, pend, current_term)) {
     164                 :          0 :             throw Xapian::DatabaseCorruptError("PostList table key has unexpected format");
     165                 :            :         }
     166                 :            :     }
     167                 :            : 
     168         [ -  + ]:         11 :     if (!startswith(current_term, prefix)) {
     169                 :            :         // We've reached the end of the prefixed terms.
     170                 :          0 :         cursor->to_end();
     171                 :          0 :         current_term.resize(0);
     172                 :            :     }
     173                 :            : 
     174                 :         17 :     RETURN(NULL);
     175                 :            : }
     176                 :            : 
     177                 :            : bool
     178                 :       1418 : BrassAllTermsList::at_end() const
     179                 :            : {
     180                 :            :     LOGCALL(DB, bool, "BrassAllTermsList::at_end", NO_ARGS);
     181 [ +  - ][ +  + ]:       1418 :     RETURN(cursor && cursor->after_end());
     182                 :            : }
 |