本文介绍C++标准模板库(STL)在算法竞赛中的常用容器及其使用方法,包括vector、stack、queue等。
C++ 标准模板库 (STL, Standard Template Library):包含一些常用数据结构与算法的模板的 C++ 软件库。其包含四个组件——算法 (Algorithms)、容器 (Containers)、仿函数 (Functors)、迭代器 (Iterators).
示例:
- 算法:
sort(a.begin(), a.end()) - 容器:
priority_queue<int> pque - 仿函数:
greater<int>() - 迭代器:
vector<int>::iterator it = a.begin()
参考来源:
- https://oiwiki.com/
- https://zh.cppreference.com
- https://io.zouht.com/
目录
1 前言
STL 作为一个封装良好,性能合格的 C++ 标准库,在算法竞赛中运用极其常见。灵活且正确使用 STL 可以节省非常多解题时间,这一点不仅是由于可以直接调用,还是因为它封装良好,可以让代码的可读性变高,解题思路更清晰,调试过程 往往 更顺利。
不过 STL 毕竟使用了很多复杂的结构来实现丰富的功能,它的效率往往是比不上自己手搓针对特定题目的数据结构与算法的。因此,STL 的使用相当于使用更长的运行时间换取更高的编程效率。因此,在实际比赛中要权衡 STL 的利弊,不过这一点就得靠经验了。
接下来,我会分享在算法竞赛中常用的 STL 容器和算法,对于函数和迭代器,就不着重展开讲了。
2 常用容器
2.1 内容总览
打勾的是本次将会详细讲解的,加粗的是算法竞赛中有必要学习的。
顺序容器
array
vector
deque
forward_list
list
关联容器
- set
- map
- multiset
- multimap
无序关联容器
- unordered_set
- unordered_map
- unordered_multiset
- unordered_multimap
容器适配器
- stack
- queue
- priority_queue
- flat_set
- flat_map
- flat_multiset
- flat_multimap
字符串
- string (basic_string<char>)
对与元组
- pair
- tuple
2.2 向量 vector
#include <vector>
连续的顺序的储存结构(和数组一样的类别),但是有长度可变的特性。
2.2.1 常用方法
构造
vector<类型> arr(长度, [初值])
时间复杂度:$O(n)$
常用的一维和二维数组构造示例,高维也是一样的(就是会有点长).
1 | vector<int> arr; // 构造int数组 |
构造二维数组的奇葩写法,千万别用:
1 | vector<int> arr[100]; // 正确,构造初始100行,不指定列数的二维数组,可用于链式前向星存图 |
尾接 & 尾删
.push_back(元素):在 vector 尾接一个元素,数组长度 $+1$..pop_back():删除 vector 尾部的一个元素,数组长度 $-1$
时间复杂度:均摊 $O(1)$
1 | // init: arr = [] |
中括号运算符
和一般数组一样的作用
时间复杂度:$O(1)$
获取长度
.size()
获取当前 vector 的长度
时间复杂度:$O(1)$
1 | for (int i = 0; i < arr.size(); i++) |
清空
.clear()
清空 vector
时间复杂度:$O(n)$
判空
.empty()
如果是空返回 true 反之返回 false.
时间复杂度:$O(1)$
改变长度
.resize(新长度, [默认值])
修改 vector 的长度
- 如果是缩短,则删除多余的值
- 如果是扩大,且指定了默认值,则新元素均为默认值 (旧元素不变)
时间复杂度:$O(n)$
2.2.2 适用情形
一般情况 vector 可以替换掉普通数组,除非该题卡常。
有些情况普通数组没法解决:$n\times m$ 的矩阵,$1\leq n,m\leq 10^6$ 且 $n\times m \leq 10^6$
- 如果用普通数组
int mat[1000010][1000010],浪费内存,会导致 MLE。 - 如果使用
vector<vector<int>> mat(n + 10, vector<int> (m + 10)),完美解决该问题。
另外,vector 的数据储存在堆空间中,不会爆栈。
2.2.3 注意事项
提前指定长度
如果长度已经确定,那么应当直接在构造函数指定长度,而不是一个一个 .push_back(). 因为 vector 额外内存耗尽后的重分配是有时间开销的,直接指定长度就不会出现重分配了。
1 | // 优化前: 522ms |
当心 size_t 溢出
vector 获取长度的方法 .size() 返回值类型为 size_t,通常 OJ 平台使用的是 32 位编译器(有些平台例如 cf 可选 64 位),那么该类型范围为 $[0,2^{32})$.
1 | vector<int> a(65536); |
2.3 栈 stack
#include <stack>
通过二次封装双端队列 (deque) 容器,实现先进后出的栈数据结构。
2.3.1 常用方法
| 作用 | 用法 | 示例 |
|---|---|---|
| 构造 | stack<类型> stk |
stack<int> stk; |
| 进栈 | .push(元素) |
stk.push(1); |
| 出栈 | .pop() |
stk.pop(); |
| 取栈顶 | .top() |
int a = stk.top(); |
| 查看大小 / 清空 / 判空 | 略 | 略 |
2.3.2 适用情形
如果不卡常的话,就可以直接用它而不需要手写栈了。
另外,vector 也可以当栈用,vector 的 .back() 取尾部元素,就相当于取栈顶,.push_back() 相当于进栈,.pop_back() 相当于出栈。
2.3.3 注意事项
不可访问内部元素!下面都是错误用法
1 | for (int i = 0; i < stk.size(); i++) |
2.4 队列 queue
#include <queue>
通过二次封装双端队列 (deque) 容器,实现先进先出的队列数据结构。
2.4.1 常用方法
| 作用 | 用法 | 示例 |
|---|---|---|
| 构造 | queue<类型> que |
queue<int> que; |
| 进队 | .push(元素) |
que.push(1); |
| 出队 | .pop() |
que.pop(); |
| 取队首 | .front() |
int a = que.front(); |
| 取队尾 | .back() |
int a = que.back(); |
| 查看大小 / 清空 / 判空 | 略 | 略 |
2.4.2 适用情形
如果不卡常的话,就可以直接用它而不需要手写队列了。
2.4.3 注意事项
不可访问内部元素!下面都是错误用法
1 | for (int i = 0; i < que.size(); i++) |
2.5 优先队列 priority_queue
#include <queue>
提供常数时间的最大元素查找,对数时间的插入与提取,底层原理是二叉堆。
2.5.1 常用方法
构造
priority_queue<类型, 容器, 比较器> pque
- 类型:要储存的数据类型
- 容器:储存数据的底层容器,默认为
vector<类型>,竞赛中保持默认即可 - 比较器:比较大小使用的比较器,默认为
less<类型>,可自定义
1 | priority_queue<int> pque1; // 储存int的大顶堆 |
对于需要自定义比较器的情况,涉及一些初学时容易看迷糊的语法(重载小括号运算符 / lambda 表达式),在此就不展开讲了。如果想要了解,可以查阅 cppreference 中的代码示例。
其他
| 作用 | 用法 | 示例 |
|---|---|---|
| 进堆 | .push(元素) |
que.push(1); |
| 出堆 | .pop() |
que.pop(); |
| 取堆顶 | .top() |
int a = que.top(); |
| 查看大小 / 判空 | 略 | 略 |
进出队复杂度 $O(\log n)$,取堆顶 $O(1)$.
2.5.2 适用情形
持续维护元素的有序性:每次向队列插入大小不定的元素,或者每次从队列里取出大小最小/最大的元素,元素数量 $n$,插入操作数量 $k$.
- 每次插入后进行快速排序:$k\cdot n\log n$
- 使用优先队列维护:$k\cdot\log n$
2.5.3 注意事项
仅堆顶可读
只可访问堆顶,其他元素都无法读取到。下面是错误用法:
1 | cout << pque[1] << endl; |
所有元素不可写
堆中所有元素是不可修改的。下面是错误用法:
1 | pque[1] = 2; |
如果你恰好要修改的是堆顶元素,那么是可以完成的:
1 | int tp = pque.top(); |
2.6 集合 set
#include <set>
提供对数时间的插入、删除、查找的集合数据结构。底层原理是红黑树。
| 集合三要素 | 解释 | set | multiset | unordered_set |
|---|---|---|---|---|
| 确定性 | 一个元素要么在集合中,要么不在 | ✔ | ✔ | ✔ |
| 互异性 | 一个元素仅可以在集合中出现一次 | ✔ | ❌(任意次) | ✔ |
| 无序性 | 集合中的元素是没有顺序的 | ❌(从小到大) | ❌(从小到大) | ✔ |
2.6.1 常用方法
构造
set<类型, 比较器> st
- 类型:要储存的数据类型
- 比较器:比较大小使用的比较器,默认为
less<类型>,可自定义
1 | set<int> st1; // 储存int的集合(从小到大) |
对于需要自定义比较器的情况,涉及一些初学时容易看迷糊的语法(重载小括号运算符 / lambda 表达式),在此就不展开讲了。
查找
1 | if (st.find(val) != st.end()){}; |
遍历
可使用迭代器进行遍历:
1 | for (set<int>::iterator it = st.begin(); it != st.end(); ++it) |
基于范围的循环(C++ 11):
1 | for (auto &ele : st) |
其他
| 作用 | 用法 | 示例 |
|---|---|---|
| 插入元素 | .insert(元素) |
st.insert(1); |
| 删除元素 | .erase(元素) |
st.erase(2); |
| 查找元素 | .find(元素) |
auto it = st.find(1); |
| 判断元素是否存在 | .count(元素) |
st.count(3); |
| 查看大小 / 清空 / 判空 | 略 | 略 |
增删查时间复杂度均为 $O(\log n)$
2.6.2 适用情形
- 元素去重:$[1,1,3,2,4,4]\to[1,2,3,4]$
- 维护顺序:$[1,5,3,7,9]\to[1,3,5,7,9]$
- 元素是否出现过:元素大小 $[-10^{18},10^{18}]$,元素数量 $10^6$,vis 数组无法实现,通过 set 可以完成。
2.6.3 注意事项
不存在下标索引
set 虽说可遍历,但仅可使用迭代器进行遍历,它不存在下标这一概念,无法通过下标访问到数据。下面是错误用法:
1 | cout << st[0] << endl; |
元素只读
set 的迭代器取到的元素是只读的(因为是 const 迭代器),不可修改其值。如果要改,需要先 erase 再 insert. 下面是错误用法:
1 | cout << *st.begin() << endl; // 正确。可读。 |
不可用迭代器计算下标
set 的迭代器不能像 vector 一样相减得到下标。下面是错误用法:
1 | auto it = st.find(2); // 正确,返回2所在位置的迭代器。 |
2.7 映射 map
#include <map>
提供对数时间的有序键值对结构。底层原理是红黑树。
映射:
$$
\begin{matrix}
1&\to&2\
2&\to&2\
3&\to&1\
4&\to&5\
&\vdots
\end{matrix}
$$
| 性质 | 解释 | map | multimap | unordered_map |
|---|---|---|---|---|
| 互异性 | 一个键仅可以在映射中出现一次 | ✔ | ❌(任意次) | ✔ |
| 无序性 | 键是没有顺序的 | ❌(从小到大) | ❌(从小到大) | ✔ |
2.7.1 常用方法
构造
map<键类型, 值类型, 比较器> mp
- 键类型:要储存键的数据类型
- 值类型:要储存值的数据类型
- 比较器:键比较大小使用的比较器,默认为
less<类型>,可自定义
1 | map<int, int> mp1; // int->int 的映射(键从小到大) |
对于需要自定义比较器的情况,涉及一些初学时容易看迷糊的语法(重载小括号运算符 / lambda 表达式),在此就不展开讲了。
遍历
可使用迭代器进行遍历:
1 | for (map<int, int>::iterator it = mp.begin(); it != mp.end(); ++it) |
基于范围的循环(C++ 11):
1 | for (auto &pr : mp) |
结构化绑定 + 基于范围的循环(C++17):
1 | for (auto &[key, val] : mp) |
其他
| 作用 | 用法 | 示例 |
|---|---|---|
| 增 / 改 / 查元素 | 中括号 | mp[1] = 2; |
| 查元素(返回迭代器) | .find(元素) |
auto it = mp.find(1); |
| 删除元素 | .erase(元素) |
mp.erase(2); |
| 判断元素是否存在 | .count(元素) |
mp.count(3); |
| 查看大小 / 清空 / 判空 | 略 | 略 |
增删改查时间复杂度均为 $O(\log n)$
2.7.2 适用情形
需要维护映射的场景可以使用:输入若干字符串,统计每种字符串的出现次数。(map<string, int> mp)
2.7.3 注意事项
中括号访问时默认值
如果使用中括号访问 map 时对应的键不存在,那么会新增这个键,并且值为默认值,因此中括号会影响键的存在性。
1 | map<char, int> mp; |
不可用迭代器计算下标
map 的迭代器不能像 vector 一样相减得到下标。下面是错误用法:
1 | auto it = mp.find('a'); // 正确,返回2所在位置的迭代器。 |
2.8 字符串 string
#include <string>
顾名思义,就是储存字符串的。
2.8.1 常用方法
构造
构造函数:string(长度, 初值)
1 | string s1; // 构造字符串,为空 |
输入输出
C++
1 | string s; |
C
1 | string s; |
其他
| 作用 | 用法 | 示例 |
|---|---|---|
| 修改、查询指定下标字符 | [] |
s[1] = 'a'; |
| 是否相同 | == |
if (s1 == s2) ... |
| 字符串连接 | + |
string s = s1 + s2; |
| 尾接字符串 | += |
s += "awa"; |
| 取子串 | .substr(起始下标, 子串长度) |
string sub = s.substr(2, 10); |
| 查找字符串 | .find(字符串, 起始下标) |
int pos = s.find("awa"); |
数值与字符串互转(C++11)
| 源 | 目的 | 函数 |
|---|---|---|
| int / long long / float / double / long double | string | to_string() |
| string | int | stoi() |
| string | long long | stoll() |
| string | float | stof() |
| string | double | stod() |
| string | long double | stold() |
2.8.2 适用情形
非常好用!建议直接把字符数组扔了,赶快投入 string 的怀抱。
2.8.3 注意事项
尾接字符串一定要用 +=
string 的 += 运算符,将会在原字符串原地尾接字符串。而 + 了再 = 赋值,会先生成一个临时变量,在复制给 string.
通常字符串长度可以很长,如果使用 + 字符串很容易就 TLE 了。
1 | // 优化前: 15139ms |
.substr() 方法的奇葩参数
一定要注意,C++ string 的取子串的第一个参数是子串起点下标,第二个参数是子串长度。
第二个参数不是子串终点!不是子串终点!要与 java 等其他语言区分开来。
.find() 方法的复杂度
该方法实现为暴力实现,时间复杂度为 $O(n^2)$.
不要幻想 STL 内置了个 $O(n)$ 的 KMP 算法
2.9 二元组 pair
#include <utility>
顾名思义,就是储存二元组的。
2.9.1 常用方法
构造
pair<第一个值类型, 第二个值类型> pr
- 第一个值类型:要储存的第一个值的数据类型
- 第二个值类型:要储存的第二个值的数据类型
1 | pair<int, int> p1; |
赋值
老式
1 | pair<int, char> pr = make_pair(1, 'a'); |
列表构造 C++11
1 | pair<int, char> pr = {1, 'a'}; |
取值
直接取值
- 取第一个值:
.first - 取第二个值:
.second
1 | pair<int, char> pr = {1, 'a'}; |
结构化绑定 C++17
1 | pair<int, char> pr = {1, 'a'}; |
判同
直接用 == 运算符
1 | pair<int, int> p1 = {1, 2}; |
2.9.2 适用场景
所有需要二元组的场景均可使用,效率和自己定义结构体差不多。
2.9.3 注意事项
无
3 迭代器简介
3.1 迭代器是什么?
不搞抽象,直接举例。
对于一个 vector,我们可以用下标遍历:
1 | for (int i = 0; i < a.size(); i++) |
我们同时也可以用迭代器来遍历:
1 | for (vector<int>::iterator it = a.begin(); it != a.end(); ++it) |
a.begin()是一个迭代器,指向的是第一个元素a.end()是一个迭代器,指向的是最后一个元素再后面一位- 上述迭代器具有自增运算符,自增则迭代器向下一个元素移动
- 迭代器与指针相似,如果对它使用解引用运算符,即
*it,就能取到对应值了
3.2 为何需要迭代器?
很多数据结构并不是线性的(例如红黑树),对于非线性数据结构,下标是无意义的。无法使用下标来遍历整个数据结构。
迭代器的作用就是定义某个数据结构的遍历方式,通过迭代器的增减,代表遍历到的位置,通过迭代器便能成功遍历非线性结构了。
例如,set 的实现是红黑树,我们是没法用下标来访问元素的。但是通过迭代器,我们就能遍历 set 中的元素了:
1 | for (set<int>::iterator it = st.begin(); it != st.end(); ++it) |
3.3 迭代器用法
对于 vector 容器,它的迭代器功能比较完整,以它举例:
.begin():头迭代器.end():尾迭代器.rbegin():反向头迭代器.rend():反向尾迭代器- 迭代器
+整型:将迭代器向后移动 - 迭代器
-整型:将迭代器向前移动 - 迭代器
++:将迭代器向后移动 1 位 - 迭代器
--:将迭代器向前移动 1 位 - 迭代器
-迭代器:两个迭代器的距离 prev(it):返回 it 的前一个迭代器next(it):返回 it 的后一个迭代器
对于其他容器,由于其结构特性,上面的功能不一定都有(例如 set 的迭代器是不能相减求距离的)
3.4 常见问题
.end() 和 .rend() 指向的位置是无意义的值
对于一个长度为 10 的数组:for (int i = 0; i < 10; i++),第 10 位是不可访问的
对于一个长度为 10 的容器:for (auto it = a.begin(); it != a.end(); ++it),.end 是不可访问的
不同容器的迭代器功能可能不一样
迭代器细化的话有正向、反向、双向,每个容器的迭代器支持的运算符也可能不同,因此不同容器的迭代器细节很有可能是不一样的。
删除操作时需要警惕
为什么 3 没删掉?
1 | vector<int> a{1, 2, 3, 4}; |
为啥 RE 了?
1 | vector<int> a{1, 2, 3, 4}; |
4 常用算法
4.1 内容总览
打勾的是本次将会详细讲解的,其他的是算法竞赛中建议学习的,不在下表列出的在比赛中基本用不到。
(很多函数的功能很简单,自己都能快速写出来,但是使用函数可以让代码可读性变得更高,这在比赛中是至关紧要的)
算法库 Algorithm
-
count() -
find() -
fill() -
swap() -
reverse() -
shuffle()C++11 -
unique() -
sort() -
lower_bound()/upper_bound() -
max()/min() -
max_element()/min_element() -
prev_permutation()/next_permutation()
-
数学函数 cmath
数值算法 numeric
伪随机数生成 random
-
mt19937 -
random_device()
-
4.2 swap()
交换两个变量的值
用法示例
1 | template< class T > |
1 | int a = 0, b = 1; |
注意事项
这个 swap 参数是引用的,不需要像 C 语言一样取地址。
4.3 sort()
使用快速排序给一个可迭代对象排序
用法示例
1 | template< class RandomIt, class Compare > |
默认排序从小到大
1 | vector<int> arr{1, 9, 1, 9, 8, 1, 0}; |
如果要从大到小,则需要传比较器进去。
1 | vector<int> arr{1, 9, 1, 9, 8, 1, 0}; |
如果需要完成特殊比较,则需要手写比较器。
比较器函数返回值是 bool 类型,传参是需要比较的两个元素。记我们定义的该比较操作为 $\star$:
- 若 $a\star b$,则比较器函数应当返回
true - 若 $a\not\star b$,则比较器函数应当返回
false
**注意:**如果 $a=b$,比较器函数必须返回 false
例: 要求对多个二元组进行如下排序:按照第二个数从小到大排;如果第二个数相同,则按照第一个数从大到小排;
1 | bool cmp(pair<int, int> a, pair<int, int> b) |
4.4 lower_bound() / upper_bound()
在已升序排序的元素中,应用二分查找检索指定元素,返回对应元素迭代器位置。找不到则返回尾迭代器。
lower_bound(): 寻找 $\geq x$ 的第一个元素的位置upper_bound(): 寻找 $>x$ 的第一个元素的位置
怎么找 $\leq x$ / $< x$ 的第一个元素呢?
- $>x$ 的第一个元素的前一个元素(如果有)便是 $\leq x$ 的第一个元素
- $\geq x$ 的第一个元素的前一个元素(如果有)便是 $<x$ 的第一个元素
返回的是迭代器,如何转成下标索引呢?减去头迭代器即可。
示例
1 | template< class ForwardIt, class T > |
1 | vector<int> arr{0, 1, 1, 1, 8, 9, 9}; |
我们通常写成一行:
1 | vector<int> arr{0, 1, 1, 1, 8, 9, 9}; |
4.5 reverse()
反转一个可迭代对象的元素顺序
用法示例
1 | template< class BidirIt > |
1 | vector<int> arr(10); |
4.6 max() / min()
返回最大值 / 最小值的数值
用法示例
1 | int mx = max(1, 2); // 2 |
在 C++11 之后,可以使用列表构造语法传入一个列表,这样就能一次性给多个元素找最大值而不用套娃了:
1 | // Before C++11 |
4.7 unique()
消除数组的重复相邻元素,数组长度不变,但是有效数据缩短,返回的是有效数据位置的结尾迭代器。
例如:$[1,1,4,5,1,4]\to[1,4,5,1,4,\underline?]$,下划线位置为返回的迭代器指向。
1 | template< class ForwardIt > |
用法示例
单独使用 unique 并不能达成去重效果,因为它只消除相邻的重复元素。但是如果序列有序,那么它就能去重了。
但是它去重后,序列尾部会产生一些无效数据:$[1,1,2,4,4,4,5]\to[1,2,4,5,\underline?,?,?]$,为了删掉这些无效数据,我们需要结合 erase.
最终,给 vector 去重的写法便是:
1 | vector<int> arr{1, 2, 1, 4, 5, 4, 4}; |
4.8 数学函数
所有函数参数均支持 int / long long / float / double / long double
| 公式 | 示例 |
|---|---|
| $f(x)=\lvert x\rvert$ | abs(-1.0) |
| $f(x)=e^x$ | exp(2) |
| $f(x)=\ln x$ | log(3) |
| $f(x,y)=x^y$ | pow(2, 3) |
| $f(x)=\sqrt x$ | sqrt(2) |
| $f(x)=\lceil x\rceil$ | ceil(2.1) |
| $f(x)=\lfloor x\rfloor$ | floor(2.1) |
| $f(x)=\left<x\right>$ | round(2.1) |
注意事项
浮点数误差问题
在《算法竞赛入门经典》第二章例题2-1中提到,浮点数运算存在精度误差。例如,整数 1 可能因为误差变成 0.999999999,此时 floor 的结果会是 0 而非预期的 1。为避免这类问题,可以使用四舍五入:floor(sqrt(x) + 0.5)。
更重要的是:当操作数都是整型时,应当避免使用浮点数运算,直接使用整数运算更加稳妥和精确,可以避免因浮点误差导致的 WA(Wrong Answer)。
推荐的整数运算写法
1. 向下取整除法 $\lfloor\frac{a}{b}\rfloor$
- ❌ 别用:
floor(1.0 * a / b) - ✅ 要用:
a / b - 示例:
1 | int a = 7, b = 3; |
2. 向上取整除法 $\lceil\frac{a}{b}\rceil$
- ❌ 别用:
ceil(1.0 * a / b) - ✅ 要用:
(a + b - 1) / b(基于公式:$\lceil\frac{a}{b}\rceil=\lfloor\frac{a+b-1}{b}\rfloor$) - 示例:
1 | int a = 7, b = 3; |
3. 平方根向下取整 $\lfloor\sqrt a\rfloor$
- ❌ 别用:
(int) sqrt(a) - ✅ 要用:二分查找
- 示例:
1 | // 二分查找计算 floor(sqrt(n)) |
4. 整数幂运算 $a^b$
- ❌ 别用:
pow(a, b) - ✅ 要用:快速幂
- 示例:
1 | // 快速幂计算 a^b |
5. 以2为底的对数向下取整 $\lfloor\log_2 a\rfloor$
- ❌ 别用:
log2(a) - ✅ 要用:
__lg(a)或bit_width(a) - 1(C++20) - 示例:
1 | int a = 15; |
4.9 gcd() / lcm()
(C++17)返回最大公因数 / 最小公倍数
1 | int x = gcd(8, 12); // 4 |
如果不是 C++17,但是是 GNU 编译器(g++),那么可以用内置函数 __gcd().
当然,gcd / lcm 函数也挺好写,直接写也行(欧几里得算法):
1 | int gcd(int a, int b) |
5 其他常用容器
本章节补充了一些在算法竞赛中也较为常用的容器,虽然使用频率不如前面章节的容器,但在特定场景下非常有用。
5.1 数组 array
#include <array>
固定长度的顺序容器,在编译期就确定大小,性能接近原生数组,但提供了 STL 容器的接口。
5.1.1 常用方法
构造
array<类型, 长度> arr
注意:长度必须是编译期常量。
时间复杂度:$O(1)$
1 | array<int, 5> arr1; // 构造长度为5的int数组,未初始化 |
访问元素
中括号运算符 [] 和 .at()
时间复杂度:$O(1)$
1 | array<int, 5> arr = {1, 2, 3, 4, 5}; |
获取首尾元素
.front():返回第一个元素.back():返回最后一个元素
时间复杂度:$O(1)$
获取长度
.size()
时间复杂度:$O(1)$
填充
.fill(值)
将所有元素设置为指定值
时间复杂度:$O(n)$
1 | array<int, 5> arr; |
5.1.2 适用情形
- 长度在编译期已知且固定的场景
- 需要 STL 接口但又追求性能的场景
- 相比普通数组,array 可以作为函数返回值、支持赋值操作
5.1.3 注意事项
长度必须是常量
1 | int n = 10; |
不能动态改变大小
array 的大小在编译期确定,无法像 vector 那样动态增长。
5.2 双端队列 deque
#include <deque>
双端队列(double-ended queue),支持在头尾两端高效插入和删除的顺序容器。
5.2.1 常用方法
构造
deque<类型> dq
1 | deque<int> dq; // 构造空双端队列 |
头尾操作
.push_front(元素):在头部插入元素.push_back(元素):在尾部插入元素.pop_front():删除头部元素.pop_back():删除尾部元素.front():访问头部元素.back():访问尾部元素
时间复杂度:均为 $O(1)$
1 | deque<int> dq; |
随机访问
中括号运算符 []
时间复杂度:$O(1)$
其他
.size():获取长度.empty():判空.clear():清空
5.2.2 适用情形
- 需要在两端进行插入删除操作的场景
- 单调队列的实现
- 滑动窗口问题
5.2.3 注意事项
性能不如 vector
deque 虽然支持随机访问,但性能不如 vector,因为其内存不是完全连续的。如果只需要尾部操作,优先使用 vector。
5.3 链表 list
#include <list>
双向链表,支持在任意位置快速插入和删除,但不支持随机访问。
5.3.1 常用方法
构造
list<类型> lst
1 | list<int> lst; // 构造空链表 |
头尾操作
.push_front(元素):在头部插入.push_back(元素):在尾部插入.pop_front():删除头部元素.pop_back():删除尾部元素.front():访问头部元素.back():访问尾部元素
时间复杂度:均为 $O(1)$
插入和删除
.insert(迭代器, 元素):在指定位置前插入.erase(迭代器):删除指定位置元素
时间复杂度:$O(1)$(需要先通过遍历找到位置)
其他操作
.sort():对链表排序.reverse():反转链表.unique():去除相邻重复元素.merge(另一个list):合并两个有序链表
5.3.2 适用情形
- 频繁在中间位置插入删除的场景
- 不需要随机访问的场景
- 实际竞赛中很少使用,一般用 vector 或 deque 代替
5.3.3 注意事项
不支持随机访问
1 | list<int> lst = {1, 2, 3, 4, 5}; |
性能开销
链表的节点不连续,缓存性能差,在竞赛中一般不推荐使用。
5.4 多重集合 multiset
#include <set>
与 set 类似,但允许元素重复出现。底层原理是红黑树。
5.4.1 常用方法
构造
multiset<类型, 比较器> mst
1 | multiset<int> mst; // 从小到大 |
插入和删除
.insert(元素):插入元素(允许重复).erase(元素):删除所有等于该元素的值.erase(迭代器):删除迭代器指向的单个元素
时间复杂度:$O(\log n)$
1 | multiset<int> mst; |
查找和计数
.find(元素):返回任意一个等于该元素的迭代器.count(元素):返回元素出现的次数
时间复杂度:$O(\log n)$(count 为 $O(\log n + k)$,$k$ 为元素个数)
其他
.size()、.empty()、.clear()
5.4.2 适用情形
- 需要维护有序序列且允许重复的场景
- 动态维护中位数
- 对顶堆的实现
5.4.3 注意事项
删除时注意是删除所有还是单个
1 | multiset<int> mst = {1, 1, 1, 2}; |
5.5 多重映射 multimap
#include <map>
与 map 类似,但允许键重复出现。底层原理是红黑树。
5.5.1 常用方法
构造
multimap<键类型, 值类型, 比较器> mmp
1 | multimap<int, int> mmp; // 键从小到大 |
插入
.insert({键, 值})或.insert(make_pair(键, 值))
时间复杂度:$O(\log n)$
1 | multimap<int, int> mmp; |
查找
.find(键):返回任意一个该键的迭代器.count(键):返回该键出现的次数.equal_range(键):返回包含所有该键元素的迭代器范围
时间复杂度:$O(\log n)$
1 | multimap<int, int> mmp = {{1, 100}, {1, 200}, {2, 300}}; |
删除
.erase(键):删除所有该键的元素.erase(迭代器):删除单个元素
时间复杂度:$O(\log n)$
5.5.2 适用情形
- 需要一对多映射的场景
- 实际竞赛中较少使用,一般用
map<键, vector<值>>代替
5.5.3 注意事项
不能使用中括号访问
1 | multimap<int, int> mmp; |
5.6 无序集合 unordered_set
#include <unordered_set>
基于哈希表实现的集合,元素无序但查找速度快。
5.6.1 常用方法
构造
unordered_set<类型> ust
1 | unordered_set<int> ust; |
插入和删除
.insert(元素):插入元素.erase(元素):删除元素
平均时间复杂度:$O(1)$,最坏 $O(n)$
查找
.find(元素):返回元素迭代器.count(元素):判断元素是否存在(返回0或1)
平均时间复杂度:$O(1)$,最坏 $O(n)$
1 | unordered_set<int> ust = {1, 3, 5, 7}; |
其他
.size()、.empty()、.clear()
5.6.2 适用情形
- 只需要判断元素是否存在,不需要有序性
- 对查找性能要求高的场景
- 元素去重但不需要排序
5.6.3 注意事项
元素无序
unordered_set 的元素是无序的,遍历时的顺序不确定。
最坏情况性能退化
当哈希冲突严重时,时间复杂度会退化到 $O(n)$。竞赛中如果被卡哈希,可以使用 set 代替。
不支持自定义类型
对于自定义类型,需要提供哈希函数,比较麻烦。
5.7 无序映射 unordered_map
#include <unordered_map>
基于哈希表实现的键值对容器,键无序但查找速度快。
5.7.1 常用方法
构造
unordered_map<键类型, 值类型> ump
1 | unordered_map<int, int> ump; |
增删改查
- 中括号
[]:访问或插入 .insert({键, 值}):插入.erase(键):删除.find(键):查找.count(键):判断键是否存在
平均时间复杂度:$O(1)$,最坏 $O(n)$
1 | unordered_map<string, int> ump; |
其他
.size()、.empty()、.clear()
5.7.2 适用情形
- 只需要键值映射,不需要键的有序性
- 对查找性能要求高的场景
- 字符串哈希、计数等场景
5.7.3 注意事项
键无序
遍历时键的顺序不确定。
可能被卡哈希
竞赛中如果被卡哈希,使用 map 代替或自定义哈希函数。
中括号的副作用
与 map 相同,使用 [] 访问不存在的键会创建该键。
5.8 无序多重集合 unordered_multiset
#include <unordered_set>
基于哈希表的 multiset,允许元素重复且无序。
5.8.1 常用方法
与 multiset 类似,但元素无序,操作的平均时间复杂度为 $O(1)$。
1 | unordered_multiset<int> umst; |
5.8.2 适用情形
需要允许重复元素,且不需要有序性,追求查找性能。
5.8.3 注意事项
实际竞赛中很少使用,一般用 unordered_map 配合计数实现。
5.9 无序多重映射 unordered_multimap
#include <unordered_map>
基于哈希表的 multimap,允许键重复且无序。
5.9.1 常用方法
与 multimap 类似,但键无序,操作的平均时间复杂度为 $O(1)$。
1 | unordered_multimap<int, int> ummp; |
5.9.2 适用情形
需要一对多映射,且不需要键的有序性。
5.9.3 注意事项
实际竞赛中很少使用,一般用 unordered_map<键, vector<值>> 代替。
5.10 元组 tuple
#include <tuple>
可以存储任意数量、任意类型元素的容器,是 pair 的扩展版本。
5.10.1 常用方法
构造
tuple<类型1, 类型2, ...> tup
1 | tuple<int, double, string> t1; |
赋值
老式写法:
1 | tuple<int, double, string> t = make_tuple(1, 3.14, "hello"); |
列表构造(C++11):
1 | tuple<int, double, string> t = {1, 3.14, "hello"}; |
取值
使用 get<索引>(tuple) 获取元素(索引从0开始):
1 | tuple<int, double, string> t = {1, 3.14, "hello"}; |
结构化绑定(C++17):
1 | tuple<int, double, string> t = {1, 3.14, "hello"}; |
获取元组大小
1 | tuple<int, double, string> t; |
5.10.2 适用情形
- 需要返回多个值的函数
- 存储三元组、四元组等多元数据
- 在 map 中使用复合键:
map<tuple<int, int, int>, int>
5.10.3 注意事项
访问语法较繁琐
相比 pair 的 .first 和 .second,tuple 的 get<0>() 语法较为冗长,建议配合 C++17 的结构化绑定使用。
可读性问题
对于元素较多的 tuple,建议定义结构体以提高代码可读性:
1 | // 不推荐 |