본문 바로가기

컴린이 일기장/Today I Learned

[TIL] 이진 탐색 알고리즘 (feat. 백준- 나무 자르기) / 파라메트릭 서치 / bisect

반응형

[Today I Learned]

# 이진 탐색 알고리즘 (이분 탐색)

- 정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법
- 시작점, 끝점, 중간점(소수점 이하 제거)을 이용해 탐색 범위 명시

+ 순차 탐색 : 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인하는 방법- 연산 횟수는 log2N에 비례, 시간 복잡도는 O(logN) 보장

# 재귀적 구현

def binary_search(array, target, start, end):
	if start > end:
    	return None
    
    mid = (start + end) // 2
    
    if array[mid] == target:
    	return mid
        
    elif array[mid] > target:
    	return binary_search(array, target, start, mid-1)
    
    else:
    	return binary_search(array, target, mid+1, end)
        
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)

if result == None:
	print('원소가 존재하지 않습니다.")
else:
	print(result+1)

 

# 반복문 구현

def binary_search(array, target, start, end):
	while start <= end:
		mid = (start+end) // 2
    
        if array[mid] == target:
            return mid
        elif array[mid] > target:
        	end = mid-1
        else:
        	start = mid + 1
   	return None
        
n, target = list(map(int, input().split()))
array = list(map(int, input().split()))

result = binary_search(array, target, 0, n-1)

if result == None:
	print('원소가 존재하지 않습니다.")
else:
	print(result+1)

 

#  파이썬 이진 탐색 라이브러리

- bisec_left(a,x) : 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스를 반환
- bisec_right(a,x) : 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 오른쪽 인덱스를 반환

from bisect import bisec_left, bisect_right

a = [1,2,4,4,8]
x = 4

print(bisect_left(a,x)) # 2
print(bisect_right(a,x)) # 4

 

+ 응용 ) 값이 특정 범위에 속하는 데이터 개수 구하기

from bisect import bisect_left, bisect_right

def count_by_range(a, left_value, right_value):
	right_index = bisect_right(a, right_value)
	left_index = bisect_left(a, left_value)
    
    return right_index - left_index
    
a = [1,2,3,3,3,3,4,4,8,9]

print(count_by_range(a,4,4)) # 2
print(count_by_range(a,-1,3)) # 6

 

# 파라메트릭 서치 (Parametric Search)

- 최적화 문제를 결정 문제 (예/아니오)로 바꾸어 해결하는 기법
- 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾도록.

+

 

[이분탐색] 파라메트릭 서치(개념)

파라메트릭 서치 문제는 단독 문제로 나오기보다는 다른 알고리즘과 결합해서 출제되는 것 같습니다. 파라메트릭 서치는 간단히 말하자면, (갓종만북의 표현을 빌려) 최적화 문제(문제의 상황

sarah950716.tistory.com

 

# 이코테 - 떡볶이 떡 만들기 (= 백준 - 나무 자르기)

문제 
오늘은 떡볶이 떡을 만드는 날이다. 떡볶이 떡의 길이가 일정하지 않지만 한 봉지 안에 들어가는 떡의 총 길이는 절단기로 잘라 맞춘다.
절단기에 높이(H)를 지정하면 줄지어진 떡을 한 번에 절단한다.높이가 H보다 긴 떡은 H 위의 부분이 잘릴 것이고, 낮은 떡은 잘리지 않는다.
예를 들어 높이가 19, 14, 10, 17cm인 떡이 나란히 있고 절단기 높이를 15cm로 지정하면 자른 뒤 떡의 높이는 15, 14, 10, 15cm가 될 것이다.
잘린 떡의 길이는 차례대로 4, 0, 0, 2cm이다. 손님은 6cm만큼의 길이를 가져간다.
손님이 왔을 때 요청한 총 길이가 M일 때 적어도 M만큼의 떡을 얻기 위해 절단기에 설정할 수 있는 높이의 최댓값을 구하는 프로그램을 작성하시오.

입력 예시
4 6
19 15 10 17

출력 예시
15

 

@solution.py

최댓값이니까 떡 개별 높이의 최댓값 -1 부터 1씩 줄여가면서 탐색하면 되지않을까? 생각했지만...
N과 M의 최대 값이 꽤나 커서, 이진 탐색을 활용할 수 있는 방향으로 고민했고, 다음과 같은 아이디어를 생각했다.

1. 이진 탐색으로 높이값들 중 조건을 만족하는 (아직 최댓값 보장 X) 값 찾기
2. 반드시 최댓값은 아닐 수 있기 때문에 그 값부터 다음 높이값 사이에 조건을 만족하는 더 큰 값 있는지 확인 (최댓값 보장하기 위해)

n, m = map(int, input().split()) # n - 떡볶이 떡 / m - 요청한 떡의 길이
heights = list(map(int, input().split()))

heights.sort() # 오름차순 정렬

def check_condition(array, target, h):
    tmp = [0 if a <= h else a-h for a in array]

    if sum(tmp) >= target:
        return True
    
    else:
        return False

def binary_search(array, target, start, end):
    while start <= end:
        mid = (start+end)//2

        if check_condition(array, target, array[mid]):
            return mid
        
        else:
            start = mid + 1 # condition 만족 못한 경우에는 무조건 그 값보다 값을 줄여야함
    
    return None

# 1. binary search로 근사값 찾기
approx = binary_search(heights, m, 0, n-1)

# 2. 최대값 보장
while check_condition(heights, m, approx):
    approx += 1

print(approx-1)

 

테스트 케이스는 통과.
그런데, 백준에 똑같은 문제가 있다고 해서 코드를 제출해봤는데 에러가 떴다.

입력 
5 20
4 42 40 26 46 (sort > 4 26 40 42 46)

위와 같은 예제에서 무한 루프에 빠지는 문제가 있었다. 또 start 값만 바꿔서는 안됨.

주어진 값들 간 간격이 클 경우에는, 이진 탐색의 장점을 충분히 활용하지 못한다는 문제가 생긴다는 점 또한 발견했다. 그래서 강의 풀이에서 힌트를 얻어 이진 탐색을 주어진 array가 아닌 0~max(array)를 대상으로 하도록 변경하였고, 최댓값 보장 과정을 따로 두는게 아니라 계속 이진 탐색을 통해 더 큰 값이 있는지 확인하도록 코드를 짰다.

 

n, m = map(int, input().split()) # n - 떡볶이 떡 / m - 요청한 떡의 길이
heights = list(map(int, input().split()))

numbers = [i for i in range(max(heights)+1)]

start = 0
end = len(numbers) - 1 # >>> idx 이기 때문에

def check_condition(array, target, h):
    tmp = [0 if a <= h else a-h for a in array]

    if sum(tmp) >= target:
        return True
    
    else:
        return False

result = 0

while start <= end:
    mid = (start+end) // 2

    if check_condition(heights, m, numbers[mid]):
        result = numbers[mid]
        start = mid + 1
    else:
        end = mid - 1

print(result)

 

이번엔 메모리 초과... 띠로리

풀면서 idx 값이 곧 numbers[idx] 값이라 array-idx를 따로 사용할 필요가 없겠다는 생각을 했었어서 그 부분을 수정해보기로 했다. 

 

n, m = map(int, input().split()) # n - 떡볶이 떡 / m - 요청한 떡의 길이
heights = list(map(int, input().split()))

start = 0
end = max(heights)

def check_condition(array, target, h):
    tmp = [0 if a <= h else a-h for a in array]

    if sum(tmp) >= target:
        return True
    
    else:
        return False

result = 0

while start <= end:
    mid = (start+end) // 2

    if check_condition(heights, m, mid):
        result = mid
        start = mid + 1
    else:
        end = mid - 1

print(result)

드디어 통과!
처음으로 메모리 초과에 걸렸어서... 아 이렇게 범위가 큰 문제에선 이런 제약도 걸릴 수 있구나 알게 되었다. : >

 

그리고 이건 강의에서 제공한 모범 풀이

+ 큰 탐색 범위를 보면 가장 먼저 이진 탐색 떠올리기! (단순 선형 탐색은 시간 초과 확률 ↑)

n, m = map(int, input().split()) # n - 떡볶이 떡 / m - 요청한 떡의 길이
heights = list(map(int, input().split()))

start = 0
end = max(heights)

result = 0
while (start <= end):
	total = 0
    mid = (start + end) // 2
    
    for x in heights:
    	if x > mid:
        	total += x - mid
   
	if total < m:
		end = mid - 1
    else:
    	result = mid
        start = mid + 1

print(result)

 

# 이코테 - 정렬된 배열에서 특정 수의 개수 구하기

문제
N개의 원소를 포함하고 있는 수열이 오름차순으로 정렬되어 있다. 이때 이 수열에서 x가 등장하는 횟수를 계산하세요. 예를 들어 수열 [1, 1, 2, 2, 2 ,2 ,3]이 있을 때 x = 2라면, 현재 수열에서 값이 2인 원소가 4개이므로 4를 출력한다. 단, 값이 x인 원소가 하나도 없다면 -1을 출력한다.
단, 이 문제는 시간 복잡도 O(logN) 으로 알고리즘을 설계하지 않으면 '시간 초과' 판정을 받는다.

입력 예시
7 2
1 1 2 2 2 2 3

출력 예시
4

뭐야 저 아직 시간 복잡도 계산도 잘못한다구요

+ 코드 시간 복잡도 계산하기

 

시간 복잡도(Time Complexity) 및 공간 복잡도(Space Complexity)

목차 시간 복잡도(Time Complexity) 및 공간 복잡도(Space Complexity) 알고리즘을 평가할 때 시간 복잡도와 공간 복잡도를 사용합니다. 시간 복잡도: 알고리즘의 수행시간을 평가 공간 복잡도: 알고리즘

yoongrammer.tistory.com

 

@solution.py

기본 count 연산을 쓰면 안되는건가? 했는데 count 연산은 전체를 탐색해서 시간 복잡도가 O(N)이라고 한다. 
그래서 시간 복잡도가 O(logN)인 bisect를 사용했다.

from bisect import bisect_left, bisect_right

n, x = map(int, input().split()) # n - 입력될 정수 개수, x - 찾아야하는 정수
numbers = list(map(int, input().split()))

""" 
count > 시간복잡도 O(N)
answer = numbers.count(x) if numbers.count(x) != 0 else -1
 
"""
left = bisect_left(numbers, x)
right = bisect_right(numbers, x)

answer = right - left if right-left != 0 else -1

print(answer)

 

강의에서 제공한 모범 풀이도 같은 방식으로 풀이했다.

반응형