Longest Common Subsequence

핵심 개념

LCS란?

두 수열에서 순서를 유지하면서 공통으로 나타나는 가장 긴 부분수열

예시

X = 'ABCDEFG'
Y = 'ARETEG'
일 경우 AEG 가 최장공통부분수열 이 된다.

공통부분 문자열과 혼동을 조심한다
공통부분 문자열 Longest Common String은 문자열이 연속해야 한다.

알고리즘 동작 원리

DP 테이블 구성: dp[i][j] = X[0:i]와 Y[0:j]의 LCS 길이

점화식:

 if X[i-1] == Y[j-1]:
     dp[i][j] = dp[i-1][j-1] + 1    # 같으면 이전 값 + 1
 else:
     dp[i][j] = max(dp[i-1][j], dp[i][j-1])  # 다르면 위/왼쪽 중 최대

복잡도:
- 시간: O(m × n)
- 공간: O(m × n) 또는 O(min(m,n))
  그림설명
  
  재귀적 접근

마지막 문자를 비교 후 문자열을 줄여가며 값을 생성하는 방식

이 케이스에선 마지막 부분이 같으니 하나씩 제거한 후 다시 비교
X = ABCD
Y = BEFD
이 케이스에선 다르니 하나씩 제거한 문자열을 비교
X = ABC
Y = BEF

2-1.
X = AB
Y = BEF

2-2.
X = ABC
Y = BE

이런 과정으로 문자열이 없어질때까지 반복 후 재귀적으로 기존문제를 해결

알고리즘 구현 과정

상향식 접근

코드

탑다운방식

복잡도 O(2^n)

def lcs(x, y):
  m, n = len(x), len(y)
  if m == 0 or n == 0: # 문자열이 하나도 없을 시 탈출
      return 0
  else:
      if x[-1] == y[-1]: # 마지막 문자열이 같다면
          return lcs(x[: (m-1)], y[: (n-1) ]) +1
      else: 
          return max(lcs(x[: (m-1)], y[:n]) , lcs(x[:m], y[:(n-1)]))

탑다운방식 + 메모이제이션

복잡도 O(mn)

def lcs_topdown_with_dp(x, y, memo=None):
  """메모화 버전"""
  if memo is None:
      memo = {}

  m, n = len(x), len(y)

  # 이미 계산된 결과가 있으면 반환
  if (m, n) in memo:
      return memo[(m, n)]

  if m == 0 or n == 0: # 탈출조건
      result = 0
  else:
      if x[-1] == y[-1]:
          result = lcs_topdown_with_dp(x[: (m - 1)], y[: (n - 1)], memo) + 1
      else:
          result = max(
              lcs_topdown_with_dp(x[: (m - 1)], y, memo),
              lcs_topdown_with_dp(x, y[: (n - 1)], memo),
          )

  memo[(m, n)] = result
  return result

상향식접근 dp

복잡도 O(mn)

def lcs_bottomup(x, y):
  x, y = [""] + x, [""] + y  # 인덱스 통일
  m, n = len(x), len(y)

  dp = [[0 for _ in range(n)] for _ in range(m)] # 최대값을 저장할 리스트
  b = [[0 for _ in range(n)] for _ in range(m)]  # 참고위치를 저장할 리스트
  for i in range(1, m):
      for j in range(1, n):
          if x[i] == y[j]:
              dp[i][j] = dp[i - 1][j - 1] + 1
              b[i][j] = 1 # 대각선을 참고했으면 1을 저장
          else:
              dp[i][j] = max(dp[i - 1][j], dp[i][j - 1])
              b[i][j] = 2 if dp[i - 1][j] > dp[i][j - 1] else 3 
              # Y의 문자열을 참고했으면 2, X의 문자열을 참고했으면 3
  return c, b

출처

주니온TV 아무거나 연구소
emplam27_velog

'Develop' 카테고리의 다른 글

Red-Black Tree 개념 (3)	2025.08.15
[C언어] 포인터, 주소, malloc.. 등등 (5)	2025.08.08
위상정렬 Topological Sort (3)	2025.07.29
우선순위 큐 (2)	2025.07.23
싱글링크드리스트 (1)	2025.07.19

핵심 개념

LCS란?

예시

알고리즘 동작 원리

그림설명

재귀적 접근

알고리즘 구현 과정

상향식 접근

코드

탑다운방식

탑다운방식 + 메모이제이션

상향식접근 dp

출처

'Develop' 카테고리의 다른 글

티스토리툴바