离散化

2021-11-26 常用算法 离散化

# 一、算法思想

离散化本质上可以看成是一种 哈希,其保证数据在哈希以后仍然保持原来的全/偏序关系。

通俗地讲就是当有些数据因为本身很大或者类型不支持,自身无法作为数组的下标来方便地处理,而 影响最终结果的只有元素之间的相对大小关系时,我们可以将原来的数据按照从大到小编号来处理问题,即离散化。

用来离散化的可以是大整数、浮点数、字符串等等。

# 二、算法模板

C++

vector<int> alls;  // 存储所有待离散化的值
sort(alls.begin(), alls.end());  // 将所有值排序
alls.erase(unique(alls.begin(), alls.end()), alls.end());   // 去掉重复元素

// 二分求出 x 对应的离散化的值,找到第一个 >= x 的位置
int find(int x)
{
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + (r - l) / 2;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1;  // 映射到 1, 2, ... , n
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

# 三、代码实战

# AcWing 0802


题目:区间和

假定有一个无限长的数轴,数轴上每个坐标上的数都是 00

现在,我们首先进行 nn 次操作,每次操作将某一位置 xx 上的数加 cc

接下来,进行 mm 次询问,每个询问包含两个整数 llrr,你需要求出在区间 [l,r][l,r] 之间的所有数的和。

输入格式

第一行包含两个整数 nnmm

接下来 nn 行,每行包含两个整数 xxcc

再接下来 mm 行,每行包含两个整数 llrr

输出格式

mm 行,每行输出一个询问中所求的区间内数字和。

数据范围

109x109−10^9 \le x \le 10^9
1n,m1051 \le n,m \le 10^5
109lr109−10^9 \le l \le r \le 10^9
10000c10000−10000 \le c \le 10000

输入样例:

3 3

1 2

3 6

7 5

1 3

4 6

7 8

输出样例:

8

0

5

解答代码:

#include <iostream>
#include <vector>
#include <algorithm>

using namespace std;

const int N = 300010;

int n, m;
int a[N], s[N];

vector<int> alls;
vector<pair<int, int>> add, query;

int find(int x)
{
    int l = 0, r = alls.size() - 1;
    while (l < r) {
        int mid = l + (r - l) / 2;
        if (alls[mid] >= x) r = mid;
        else l = mid + 1;
    }
    return r + 1;  // 映射到 1, 2, ... , n
}

int main()
{
    cin >> n >> m;
    
    for (int i = 0; i < n; i++) {
        int x, c;
        cin >> x >> c;
        add.push_back({x, c});
        
        alls.push_back(x);
    }
    for (int i = 0; i < m; i++) {
        int l, r;
        cin >> l >> r;
        query.push_back({l, r});
        
        alls.push_back(l);
        alls.push_back(r);
    }
    
    // 去重
    sort(alls.begin(), alls.end());
    alls.erase(unique(alls.begin(), alls.end()), alls.end());
    
    // 处理累加操作
    for (int i = 0; i < add.size(); i++) {
        int x = find(add[i].first);
        a[x] += add[i].second;
    }
    
    // 预处理前缀和
    for (int i = 1; i <= alls.size(); i++) {
        s[i] = s[i - 1] + a[i];
    }
    
    // 处理查询操作
    for (int i = 0; i < query.size(); i++) {
        int l = find(query[i].first), r = find(query[i].second);
        cout << s[r] - s[l - 1] << endl;
    }
    
    return 0;
}
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
Last Updated: 2023-01-28 4:31:25