Offline Range MEX queries in O(log n)
Difference between en17 and en18, changed 30 character(s)
Consider the following problem : ↵

Your are given an array $a$ of size $n$ and $q$ queries of form $(l_1, r_1), (l_2, r_2), ..., (l_q, r_q)$. For each query you have to find the MEX of the array $a_l, a_{l+1}, ..., a_r$.↵
The queries are offline.↵

$0 \le a_1, a_2, ..., a_n \le n$ ↵

$1 \le l_i \le r_i \le n$, for all $1 \le i \le q$↵

The approach to the problem is discussed [here](https://stackoverflow.com/questions/41633225/please-tell-me-the-efficient-algorithm-of-range-mex-query).↵

First let's consider a special case of the queries where $r = n$. In this case we want to find the smallest integer that does not occur in the subarray $a_l, ..., a_r$. That is, the smallest integer that does not occur at index $l$ or after it.↵

For all $0 \le x \le n$, let $b_x$ be the greatest index $i$ such that $a_i = x$, and $0$ if no such $a_i$ exists.↵

Now the MEX say $m$ of subarray $a_l, ..., a_n$ either does not occur in $a$, in which case we have $b_m = 0$, or the last occurence of $m$ in $a$ is before $l$, thus $b_m < l$. We can say that $m$ is the minimum of all such numbers, thus $m$ = $min$ { $i$ | $b_i < l$ }.↵

Now since the queries are offline, we can sort the queries by $r$ and process them such that we can ignore the subarray $a_{r + 1}, ..., a_n$.↵
We iterate from from $r = 1, 2, ..., n$, and for each $r$ we process all queries $(l_i, r_i)$ where $r_i = r$.↵

Now how do we efficiently calculate the answer for queries $(l, n)$ ?↵

We maintain a minimum segment tree on the array $b$ and update all values for $i = 1, 2, ..., r$. Now since there are $n$ updates but $n + 1$ leaf nodes in the segment tree, at least one of them is zero. So value of root node is $0$. Now we try to find the minimum index leaf node with value < $l$. We start at root node and travel down to this node. At each node we see if the value of it's left child is < $l$. If it is we go to left child. Otherwise we go to the right child.↵
Either of left or right child will always have value < $l$. Finally we reach a leaf node, the index of this node(after adjusting for offset) is the mex of array $a_l, a_{l + 1}, ..., a_r$.↵

Consider the array $a = [6, 1, 0]$.↵

Here $b = [3, 2, 0, 0, 0, 0, 1, 0]$.↵

Consider evaluation for $l = 2, r = 3$. The subarray is $[a_2, a_3] = [1, 0]$.↵

We start at root node.↵

![ ](https://i.imgur.com/5TOuXF6.png)↵

We see that the left child has value < $l$
, so we go to the left child.↵

![ ](https://i.imgur.com/iMvzcnX.png)↵

Now for left node $2 \ge l$. So we go to right node.↵

![ ](https://i.imgur.com/ZizWtSY.png)↵

Now for the left child value < $l$. So we go to left child.↵

![ ](https://i.imgur.com/s3TKI0p.png)↵

We have reached a leaf node. The corresponding index is 2 and thus the MEX of the subarray $
[a_2, a_3]$ is 2.↵

Calculating MEX of each query takes $O(log n)$ time, total $O(q log n)$. Updating the tree for $b$ takes $O(n log n)$ time in total. Sorting $q$ queries takes $O(q log q)$ time.↵

Overall time complexity &mdash; $O(n log n + q(log n + log q))$↵

~~~~~↵
#include<bits/stdc++.h>↵
using namespace std;↵
#define ll long long↵
struct SegmentTree{↵
    int n;↵
    vector<int> tree;↵
    SegmentTree(int sz){↵
        n = 1;↵
        while(n < sz){↵
            n <<= 1;↵
        }↵
        tree.assign(2 * n, 0);↵
    }↵
    void set(int ind, int val){↵
        ind += n;↵
        tree[ind] = val;↵
        ind >>= 1;↵
        while(ind > 0){↵
            tree[ind] = min(tree[2 * ind], tree[2 * ind + 1]);↵
            ind >>= 1;↵
        }↵
    }↵
    int get(int x){↵
        // return the first index i, such that s[i] < x↵
        int node = 1;↵
        while(node < n){↵
            int left = (node << 1);↵
            int right = (node << 1) + 1;↵
            if(tree[left] < x){↵
                node = left;↵
            }else{↵
                node = right;↵
            }↵
        }↵
        return (node - n);↵
    }↵
};↵
int main(){↵
    int n;↵
    cin >> n;↵
    vector<int> a(n + 1);↵
    for(int i = 1; i <= n; ++i){↵
        cin >> a[i];↵
    }↵
    int q;↵
    cin >> q;↵
    vector<vector<pair<int, int>>> queries(n + 1);↵
    for(int i = 0; i < q; ++i){↵
        int l, r;↵
        cin >> l >> r;↵
        queries[r].push_back({l, i});↵
    }↵

    vector<int> res(q);↵

    SegmentTree s(n + 1);↵
    for(int i = 1; i <= n; ++i){↵
        // set the last occurence of a[i] to i↵
        s.set(a[i], i);↵

        for(auto [l, ind] : queries[i]){↵
            // find the smallest x, such that last occurence of x < l↵
            res[ind] = s.get(l);↵
        }↵
    }↵
    for(int elem : res){↵
        cout << elem << '\n';↵
    }↵
    cout << '\n';↵

    return 0;↵
}↵
~~~~~↵

History

 
 
 
 
Revisions
 
 
  Rev. Lang. By When Δ Comment
en19 English one_autum_leaf 2023-06-27 20:24:52 15 Tiny change: 'discussed [here](ht' -> 'discussed in the comment [here](ht'
en18 English one_autum_leaf 2023-06-27 20:24:09 30 (published)
en17 English one_autum_leaf 2023-06-27 20:22:14 26 Tiny change: ', 0]$.\n\n![ ](' -> ', 0]$.\n\nWe start at root node.\n\n![ ]('
en16 English one_autum_leaf 2023-06-27 20:21:28 41
en15 English one_autum_leaf 2023-06-27 20:19:03 2 Tiny change: 'dash; $O(nlog n + q(log ' -> 'dash; $O(n \log_n + q(log '
en14 English one_autum_leaf 2023-06-27 20:16:20 1 Tiny change: 'O(q log n). Updating' -> 'O(q log n)$. Updating'
en13 English one_autum_leaf 2023-06-27 20:15:42 253
en12 English one_autum_leaf 2023-06-27 20:12:53 15 Tiny change: 'array is $1, 0$.\n\n![ ]' -> 'array is $[a_2, a_3] = [1, 0]$.\n\n![ ]'
en11 English one_autum_leaf 2023-06-27 20:12:17 519 Tiny change: 'imgur.com/a/UkzuMa5)\n\n~~~~~' -> 'imgur.com/5TOuXF6)\n\n~~~~~'
en10 English one_autum_leaf 2023-06-27 20:02:50 35 Tiny change: '., a_r$.\n\n~~~~~\' -> '., a_r$.\n![ ](https://imgur.com/a/UkzuMa5)\n\n~~~~~\'
en9 English one_autum_leaf 2023-06-27 19:48:07 163
en8 English one_autum_leaf 2023-06-27 19:45:55 1610 Tiny change: 'egin{math}a_x = 1\end{math}\begin{math}a_x = 1\end{math}\begin{math}' -> 'egin{math}'
en7 English one_autum_leaf 2023-06-27 19:10:31 36
en6 English one_autum_leaf 2023-06-27 19:09:34 3 Tiny change: 'et $b_x = $ \bigl\{\n\n~~~~~\' -> 'et $b_x = \bigl\{ $\n\n~~~~~\'
en5 English one_autum_leaf 2023-06-27 19:09:15 199
en4 English one_autum_leaf 2023-06-27 19:00:34 1566
en3 English one_autum_leaf 2023-06-27 18:52:21 180
en2 English one_autum_leaf 2023-06-27 18:50:49 2 Tiny change: 'y $a_l, a_l+1, ..., a_r' -> 'y $a_l, a_{l+1}, ..., a_r'
en1 English one_autum_leaf 2023-06-27 18:50:11 222 Initial revision (saved to drafts)