最长连续序列

scorlw 发布于

最长连续序列

关键词:unordered_set、哈希表

题目描述

给定一个未排序的整数数组,找出最长连续序列的长度。

要求算法的时间复杂度为 O(n)

示例 1:

1
2
3
输入: [100, 4, 200, 1, 3, 2]
输出: 4
解释: 最长连续序列是 [1, 2, 3, 4]。它的长度为 4

思路

思路一:

我们考虑枚举数组中的每个数 x,考虑以其为起点,不断尝试匹配 x+1,x+2,⋯是否存在,假设最长匹配到了 x+y,那么以 x 为起点的最长连续序列即为 x,x+1,x+2,⋯ ,x+y,其长度为y+1,我们不断枚举并更新答案即可。

对于匹配的过程,暴力的方法是 O(n) 遍历数组去看是否存在这个数,但其实更高效的方法是用一个哈希表存储数组中的数,这样查看一个数是否存在即能优化至 O(1) 的时间复杂度。

仅仅是这样我们的算法时间复杂度最坏情况下还是会达到 O(n^2)(即外层需要枚举 O(n) 个数,内层需要暴力匹配 O(n)次),无法满足题目的要求。但仔细分析这个过程,我们会发现其中执行了很多不必要的枚举,如果已知有一个 x,x+1,x+2,⋯,x+y 的连续序列,而我们却重新从 x+1,x+2或者是 x+y处开始尝试匹配,那么得到的结果肯定不会优于枚举 x为起点的答案,因此我们在外层循环的时候碰到这种情况跳过即可。

那么怎么判断是否跳过呢?由于我们要枚举的数 x 一定是在数组中不存在前驱数 x−1的,不然按照上面的分析我们会从 x−1 开始尝试匹配,因此我们每次在哈希表中检查是否存在 x−1 即能判断是否需要跳过了。

增加了判断跳过的逻辑之后,时间复杂度是多少呢?外层循环需要 O(n)的时间复杂度,只有当一个数是连续序列的第一个数的情况下才会进入内层循环,然后在内层循环中匹配连续序列中的数,因此数组中的每个数只会进入内层循环一次。根据上述分析可知,总时间复杂度为 O(n),符合题目要求。

代码

思路一:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
int longestConsecutive(vector<int>& nums)
{
unordered_set<int> num_set;
//使用unordered_set过滤数组中的重复元素
for(const int& num : nums){
num_set.insert(num);
}
//初始化最长连续序列长度为0
int longestStreak = 0;

for(const int &num : num_set){
//因为序列需要从头数,所以如果比当前读到的值num小1的数就跳过
if(!num_set.count(num - 1)){//num_set中num - 1的个数
int currentNum = num;
int currentStreak = 1;

while(num_set.count(currentNum + 1)){//读取满足序列的长度
currentNum += 1;
currentStreak +=1;
}

longestStreak = max(longestStreak, currentStreak);
}
}
return longestStreak;
}

包含IO的代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
#include <iostream>
#include <vector>
#include <unordered_set>

using namespace std;
int longestConsecutive(vector<int>& nums)
{
unordered_set<int> num_set;
//使用unordered_set过滤数组中的重复元素
for(const int& num : nums){
num_set.insert(num);
}
//初始化最长连续序列长度为0
int longestStreak = 0;

for(const int &num : num_set){
//因为序列需要从头数,所以如果比当前读到的值num小1的数就跳过
if(!num_set.count(num - 1)){//num_set中num - 1的个数
int currentNum = num;
int currentStreak = 1;

while(num_set.count(currentNum + 1)){//读取满足序列的长度
currentNum += 1;
currentStreak +=1;
}

longestStreak = max(longestStreak, currentStreak);
}
}
return longestStreak;
}

int main()
{
int x = 0;
vector<int> v;
while(cin >> x)
{
v.push_back(x);
if(cin.get() == '\n')
{
break;
}
}
int len = longestConsecutive(v);
cout << len << endl;
return 0;
}

知识点

  1. unordered_set的使用,特性,count等函数;
  2. 哈希表的思路。