알고리즘/정리

정렬 알고리즘 (Sorting Algorithm)

sssbin 2022. 2. 4. 18:03

 

정렬

데이터를 특정한 기준에 따라서 순서대로 나열하는 것

 

 

선택 정렬

: 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸고, 그다음 작은 데이터를 선택해 앞에서 두 번째 데이터와 바꾸는 과정을 반복

 -> 매번 '가장 작은 것을 선택'

- 시간복잡도 O(N^2)

     ㄴ 연산횟수: N + (N-1) + (N-2) + ··· 2 → N*(N+1)/2 → O(N^2)

     ㄴ 소스코드: 2중 반복문 사용

# 선택 정렬

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(len(array)):
    min_index = i   # 가장 작은 원소의 인덱스
    for j in range(i+1, len(array)):
        if array[min_index] > array[j]:
            min_index = j
    array[i], array[min_index] = array[min_index], array[i]    # swap

print(array)

 

 

삽입 정렬

- 선택 정렬은 현재 데이터의 상태와 상관없이 무조건 모든 원소를 비교하고 위치를 바꾸는 방면 삽입 정렬은 필요할 때만 위치를 바꾼다.

- 특정한 데이터를 적절한 위치에 '삽입'한다. 

   정렬되어 있는 데이터 리스트에서 적절한 위치를 찾은 뒤에, 그 위치에 삽입된다.

- 시간 복잡도 O(N^2)

    ㄴ 현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작 O(N)

- 정렬이 이루어진 원소는 항상 오름차순을 유지

   -> 삽입 정렬에서는 특정한 데이터가 삽입될 위치를 선정할 때,

        삽입될 데이터보다 작은 데이터를 만나면 그 위치에서 멈추면 된다.

# 삽입 정렬

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

for i in range(1, len(array)):
    for j in range(i, 0, -1):   # 인덱스 i부터 1까지 감소하며 반복하는 문법
        if array[j] < array[j-1]:   # 한 칸씩 왼쪽으로 이동
            array[j], array[j-1] = array[j-1], array[j]
        else:   # 자기보다 작은 데이터를 만나면 그 위치에서 멈춤
            break

print(array)

 

 

퀵 정렬

- 기준을 설정한 다음 큰 수와 작은 수를 교환한 후 리스트를 반으로 나누는 방식으로 동작

- 피벗(교환하기 위한 기준) 설정

    → 왼쪽부터 피벗보다 큰 데이터를 찾고, 오른쪽부터 피벗보다 작은 데이터를 찾는다.

    → 큰 데이터와 작은 데이터의 위치를 서로 교환해준다.

    → 이러한 과정을 반복하면 '피벗'에 대하여 정렬이 수행된다.

- 시간 복잡도 O(NlogN)

    ㄴ 피벗을 리스트의 가장 왼쪽 데이터로 삼을 때

        '이미 데이터가 정렬되어 있는 경우'에는 O(N^2)

- 특정한 리스트에서 피벗을 설정하여 정렬을 수행한 이후에,

   피벗을 기준으로 왼쪽 리스트와 오른쪽 리스트에서 각각 다시 정렬을 수행

- '재귀 함수'와 동작 원리가 같다.

    ㄴ 종료 조건: 현재 리스트의 데이터 개수가 1개

                        (이미 정렬이 되어 있다고 간주할 수 있으며 분할 불가능)

# 퀵 정렬

array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array, start, end):
    if start >= end:    # 원소가 1개인 경우 종료
        return
    pivot = start   # 피벗은 첫 번째 원소
    left = start + 1
    right = end
    while left <= right:
        # 피벗보다 큰 데이터를 찾을 때까지 반복
        while left <= end and array[left] <= array[pivot]:
            left += 1
        # 피벗보다 작은 데이터를 찾을 때까지 반복
        while right > start and array[right] >= array[pivot]:
            right -= 1
        if left > right:    # 엇갈렸다면 작은 데이터와 피벗을 교체
            array[right], array[pivot] = array[pivot], array[right]
        else:   # 엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
            array[left], array[right] = array[right], array[left]
    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
    quick_sort(array, start, right-1)
    quick_sort(array, right+1, end)

quick_sort(array, 0, len(array)-1)
print(array)
# 파이썬의 장점을 살린 퀵 정렬

# 피벗과 데이터를 비교하는 비교 연산 횟수가 증가하므로 시간 면에서는 조금 비효율적이다.
# 하지만 더 직관적이고 기억하기 쉽다는 장점이 있다.

array = [5, 7, 9, 0, 3, 1, 6, 2, 4, 8]

def quick_sort(array):
    # 리스트가 하나 이하의 원소만을 담고 있다면 종료
    if len(array) <= 1:
        return array

    pivot = array[0]    # 피벗의 첫 번째 원소
    tail = array[1:]    # 피벗을 제외한 첫 번째 리스트
    
    left_side = [x for x in tail if x <= pivot]    # 분할된 왼쪽 부분
    right_side = [x for x in tail if x > pivot]    # 분할된 오른쪽 부분

    # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬을 수행하고, 전체 리스트를 반환
    return quick_sort(left_side) + [pivot] + quick_sort(right_side)

print(quick_sort(array))

 

 

계수 정렬

- 비교 기반의 정렬 알고리즘이 아님.

- 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠른 정렬 알고리즘

- '데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때'만 사용

- '모든 범위를 담을 수 있는 크기의 리스트(배열)를 선언'해야 함.

- 별도의 리스트를 선언하고 그 안에 정렬에 대한 정보를 담는다.

- 시간 복잡도 O(N+K)

    ㄴ 모든 데이터가 양의 정수인 상황에서 데이터의 개수가 N, 데이터 중 최댓값이 K일 때

- 공간 복잡도 O(N+K)

    ㄴ 데이터의 크기가 한정되어 있고, 데이터의 크기가 많이 중복되어 있을수록 유리

# 계수 정렬

# 모든 원소의 값이 0보다 크거나 같다고 가정
array = [7, 5, 9, 0, 3, 1, 6, 2, 9, 1, 4, 8, 0, 5, 2]
# 모든 범위를 포함하는 리스트 선언 (모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)

for i in range(len(array)):
    count[array[i]] += 1    # 각 데이터에 해당하는 인덱스의 값 증가

for i in range(len(count)):    # 리스트에 기록된 정렬 정보 확인
    for j in range(count[i]):
        print(i, end=' ')   # 띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력

 

 

정렬 라이브러리

(1) sorted()

    - 퀵 정렬과 동작 방식이 비슷한 병합 정렬을 기반으로 만들어짐.

    - 일반적으로 퀵 정렬보다 느리지만 최악의 경우에도 O(NlogN) 보장

    - 리스트, 딕셔너리 자료형 등을 입력받아서 정렬된 결과 출력

    - 반환되는 결과는 리스트 자료형

(2) sort()

    - 리스트 객체의 내장 함수

    - 리스트 변수가 하나 있을 때 내부 원소를 바로 정렬

    - 별도의 정렬된 리스트가 반환되지 않고 내부 원소가 바로 정렬됨.

# 정렬 라이브러리

array = [7, 5, 9, 0, 3, 1, 6, 2, 4, 8]

result = sorted(array)  # sorted()
print(result)
print(array)

array.sort()            # sort()
print(array)

- sorted()나 sort()를 이용할 때에는 key 매개변수를 입력으로 받을 수 있다.

- key 값으로는 하나의 함수가 들어가야 하며 이는 정렬 기준이 된다.

- 혹은 람다(lambda) 함수를 사용할 수도 있다.

# 정렬 라이브러리에서 key를 활용

array = [('바나나', 2), ('사과', 5), ('당근', 3)]

def setting(data):
    return data[1]

result = sorted(array, key=setting)
print(result)

 

 

실전 문제1. 위에서 아래로

# 정렬
# 실전 문제1. 위에서 아래로

n = int(input())
num = []
for i in range(n):
    num.append(int(input()))

num.sort(reverse=1)
for i in num:
    print(i, end=' ')

- 수의 개수가 500개 이하로 매우 적으며, 모든 수는 1 이상 100,000 이하이므로 어떠한 정렬 알고리즘을 사용해도 문제를 해결할 수 있다.

- 어떠한 정렬을 이용해도 상관없지만 가장 코드가 간결해지는 파이썬의 기본 정렬 라이브러리를 이용하는 것이 효과적이다.

 

 

실전 문제2. 성적이 낮은 순서로 학생 출력하기

- 내 코드: key를 이용하여 점수를 기준으로 정렬할 때 grade 함수 만듦.

# 정렬
# 실전 문제2. 성적이 낮은 순서로 학생 출력하기

n = int(input())
info = []
for i in range(n):
    a, b = input().split()
    info.append((a, int(b)))

def grade(info):
    return info[1]

info.sort(key=grade)
for i in info:
    print(i[0], end=' ')

- 교재 코드: 학생 정보를 입력받을 때 리스트 사용해서 인덱싱함.

                   key를 이용하여 점수를 기준으로 정렬할 때 lambda 함수 이용

# 정렬
# 실전 문제2. 성적이 낮은 순서로 학생 출력하기
# 교재 코드

n = int(input())
array = []
for i in range(n):
    input_data = input().split()
    array.append((input_data[0], int(input_data[1])))
    
array = sorted(array, key=lambda student:student[1])
for student in array:
    print(student[0], end=' ')

 

 

실전 문제3. 두 배열의 원소 교체

# 정렬
# 실전 문제3. 두 배열의 원소 교체

n, k = map(int, input().split())
a = list(map(int, input().split()))
b = list(map(int, input().split()))

a.sort()
b.sort(reverse=1)

for i in range(k):
    if a[i] < b[i]:
        a[i], b[i] = b[i], a[i]
    else:
        break

print(sum(a))

- a의 가장 작은 원소를 최대 k개 골라서 b의 가장 큰 원소들로 바꿔주면 된다.

- 따라서 a는 오름차순 정렬, b는 내림차순 정렬

- 이때 앞에서부터 차례대로 각 배열의 원소를 비교해서 b의 원소가 더 크면 바꿔치기 해주면 됨.