알고리즘 / 자료구조’ 시리즈

[이.취.코] Chap 5. DFS, BFS - DFS, BFS 개념

  • 0
  • 0
0
0

1. 탐색 알고리즘 DFS/BFS

a. [[그래프의 기본 구조]]

노드(node)와 간선(edge)으로 표현되며 노드를 정점(Vertex)라고도 말한다.

  • 그래프 탐색
    • 하나의 노드를 시작으로 다수의 노드를 방문하는 것

두 노드가 간선으로 연결되어 있다면 두 노드는 인접하다(Adjacent) 라고 표현한다.

프로그래밍에서 그래프는 크게 2가지 방식으로 표현할 수 있다.

  • [[인접 행렬 (Adjacency Matrix)]]

    2차원 배열로 그래프의 연결 관계를 표현하는 방식

    2차원 배열에 각 노드가 연결된 형태를 기록하는 방식

    파이썬에서는 2차원 리스트로 구현할 수 있다.

    연결되지 않은 노드끼리는 무한(Infinity)의 비용이라고 작성한다. 무한은 보통 논리적으로 정답이 될 수 없는 큰 값 중에서 999999999, 987654321 등의 값으로 초기화하는 경우가 많다.

    
    INF = 999999999  
    
    graph = [  
        [0, 7, 5],  
     [7, 0, INF],  
     [5, INF, 0]  
    ]  
    
    print(graph)
    
    
    
    [[0, 7, 5], [7, 0, 999999999], [5, 999999999, 0]]
    
    
  • [[인접 리스트 (Adjacency List)]]

    리스트로 그래프의 연결 관계를 표현하는 방식

    모든 노드에 연결된 노드에 대한 정보를 차례대로 연결하여 저장한다.

    인접 리스트는 연결 리스트라는 자료구조를 이용해 구현한다. 파이썬은 기본 자료형인 리스트 자료형이 append()와 메소드를 제공한다.

    리스트는 배열과 연결 리스트의 기능을 모두 기본으로 제공한다.

    파이썬으로 인접 리스트를 이용해 그래프를 표현하고자 할 때에도 단순히 2차원 리스트를 이용하면 된다.

    
    graph = [[] for _ in range(3)]  
    
    graph[0].append((1, 7))  
    graph[0].append((2, 5))  
    
    graph[1].append((0, 7))  
    
    graph[2].append((0, 5))  
    
    print(graph)
    
    
    
    [[(1, 7), (2, 5)], [(0, 7)], [(0, 5)]]
    
    
  • 인접 행렬과 인접 리스트의 메모리와 속도 비교

    인접 행렬 방식은 모든 관계를 저장하므로 노드 개수가 많을수록 메모리가 불필요하게 낭비된다.

    인접 리스트 방식은 연결된 정보만을 저장하기 때문에 메모리를 효율적으로 사용한다. 하지만 인접 행렬에 비해 특정한 두 노드가 연결되어 있는지에 대한 정보를 얻는 속도가 느리다.

b. DFS

깊이 우선 탐색이라 부르며, 그래프에서 깊은 부분을 우선적으로 탐색하는 알고리즘이다.

특정한 경로로 탐색하다가 특정한 사오항에서 최대한 깊숙이 들어가서 노드를 방문한 후, 다시 돌아가 다른 경로로 탐색하는 알고리즘.

DFS는 스택 자료구조를 이용한다.

  1. 탐색 시작 노드를 스택에 삽입하고 방문 처리한다.
  2. 스택의 최상단 노드에 방문하지 않은 인접 노드가 있으면 그 인접 노드를 스택에 넣고 방문 처리 한다. 방문하지 않은 인접 노드가 없으면 스택에서 최상단 노드를 꺼낸다.
  3. 더 이상 수행할 수 없을 때까지 반복한다.

방문 처리를 함으로써 각 노드를 한 번씩만 처리할 수 있다.

일반적으로 인접한 노드 중에서 방문하지 않은 노드가 여러 개 있으면 번호가 낮은 순서부터 처리한다.

DFS는 스택 자료구조에 기초한다는 점에서 구현이 간단하다. 스택을 쓰지 않아도 되며 탐색을 수행함에 있어서 데이터의 개수가 N개인 경우 O(N)의 시간이 소요된다는 특징이 있다.


def dfs(graph, v, visited):  
    visited[v] = True  
 print(v, end=' ')  
    for i in graph[v]:  
        if not visited[i]:  
            dfs(graph, i, visited)  
  
graph = [  
    [],  
 [2, 3, 8],  
 [1, 7],  
 [1, 4, 5],  
 [3, 5],  
 [3, 4],  
 [7],  
 [2, 6, 8],  
 [1, 7]  
]  
  
visited = [False] * 9  
  
dfs(graph, 1, visited)


1 2 7 6 8 3 4 5 

B. [[BFS (Breadth-First Search)]]

b. BFS

너비 우선 탐색

가까운 노드부터 탐색하는 알고리즘

BFS 구현에서는 선입선출 방식인 큐 자료구조를 이용한다. 인접한 노드를 반복적으로 큐에 넣도록 알고리즘을 작성하면 자연스럽게 먼저 들어온 것이 먼저 나가게 되어, 가까운 노드부터 탐색을 진행하게 된다.

  1. 탐색 시작 노드를 큐에 삽입하고 방문 처리를 한다.
  2. 큐에서 노드를 꺼내 해당 노드의 인접 노드 중에서 방문하지 않은 노드를 모두 큐에 삽입하고 방문 처리 한다.
  3. 더 이상 수행할 수 없을 때까지 반복한다.

숫자가 작은 노드부터 먼저 큐에 삽입한다고 가정한다.

BFS는 큐 자료구조에 기초한다는 점에서 구현이 간단하다. deque 라이브러리를 사용하며 탐색을 수행함에 있어 O(N)의 시간이 소요된다.

일반적인 경우 실제 수행 시간은 DFS보다 좋은 편이다.


from collections import deque  
  
def bfs(graph, start, visited):  
    queue = deque([start])  
    visited[start] = True  
  
 while queue:  
        v = queue.popleft()  
        print(v, end=' ')  
  
        for i in graph[v]:  
            if not visited[i]:  
                queue.append(i)  
                visited[i] = True  
  
graph = [  
    [],  
 [2, 3, 8],  
 [1, 7],  
 [1, 4, 5],  
 [3, 5],  
 [3, 4],  
 [7],  
 [2, 6, 8],  
 [1, 7]  
]  
  
visited = [False] * 9  
bfs(graph, 1, visited)


1 2 3 8 7 4 5 6 

C. 결론

DFSBFS
동작 원리스택
구현 방법재귀 함수 이용큐 자료구조 이용

1차원 배열이나 2차원 배열 또한 그래프 형태로 생각하면 쉽게 문제를 풀 수 있다. 특히 DFS와 BFS 문제 유형이 그렇다.

코딩 테스트 중 2차원 배열에서의 탐색 문제를 그래프 형태로 표현한 다음 풀이법을 고민해보자.

참고문헌

나동빈, "이것이 취업을 위한 코딩 테스트다 with 파이썬", 초판, 2쇄, 한빛미디어, 2020년

0분전
작성된 댓글이 없습니다. 첫 댓글을 달아보세요!
    댓글을 작성하려면 로그인이 필요합니다.