2024. 2. 7. 13:22ㆍ코딩 도구/글
정렬 알고리즘 정의를 내가 아는가?
정렬 알고리즘 | 정의 |
버블 | 데이터의 인접 요소끼리 비교, swap 연산을 수행하며 정렬 |
선택 | 대상에서 가장 크거나 작은 데이터를 찾아서 선택을 반복하며 정렬 |
삽입 | 대상을 선택해 정렬된 영역에서 선택 데이터의 적절한 위치를 찾아 삽입하면서 정렬 |
퀵 | pivot 값을 선정해 해당 값을 기준으로 정렬 |
병합 | 이미 정렬된 부분 집합들을 병합해 전체를 정렬 |
기수 | 데이터의 자릿수를 바탕으로 비교해 데이터를 정렬 |
버블 정렬의 핵심 이론
버블 정렬 (bubble sort)은 두 인접한 데이터의 크기를 비교해 정렬하는 방법입니다.
간단하게 구현할 순 있지만, 시간 복잡도는 O(n^2)으로 다른 정렬 알고리즘보다 속도가 느린 편입니다.
다음 그림과 같이 루프를 돌면서 인접한 데이터 간의 swap 연산으로 정렬합니다.
버블 정렬 과정
1. 비교 연산이 필요한 루프 범위를 설정한다.
2. 인접한 데이터 값을 비교한다.
3. swap 조건에 부합하면 Swap 연산을 수행한다.
4. 루프 범위가 끝날 때까지 2~3을 반복한다.
5. 정렬 영역을 설정한다. 다음 루프를 실행할 때는 이 영역을 제외한다.
6. 비교 대상이 없을 때까지 1~5를 반복한다.
선택 정렬
선택 정렬 (selection sort)은 대상 데이터에서 최대나 최소 데이터를 데이터가 나열된 순으로 찾아가며 선택하는 방법입니다.
선택 정렬은 구현 방법이 복잡하고, 시간 복잡도도 O(n)으로 효율적이지 않아 코딩 테스트에서는 많이 사용하지 않습니다. 선택 정렬 원리만 간단히 알아보고 넘어가겠습니다.
선택 정렬의 핵심 이론
최솟값 또는 최댓값을 찾고, 남은 정렬 부분의 가장 앞에 있는 데이터와 Swap하는 것이 선택 정렬의 핵심입니다.
선택 정렬 과정
1. 남은 정렬 부분에서 최솟값 또는 최댓값을 찾는다.
2. 남은 정렬 부분에서 가장 앞에 있는 데이터와 선택된 데이터를 Swap한다.
3. 가장 앞에 있는 데이터의 위치를 변경해(index++) 남은 정렬 부분의 범위를 축소한다.
4. 전체 데이터 크기만큼 index가 커질 때까지, 즉 남은 정렬 부분이 없을 때까지 반복한다.
선택 정렬 자체를 묻는 코딩 데스트 문제는 잘 나오지 않는다고 하지만, 이 원리를 응용하는 문제는 나올 수 있으므로 신택 정렬이 이떤 원리로 작동하는지는 알아 두자.
삽입 정렬
삽입 정렬 (insertion sort) 은 이미 정렬된 데이터 범위에 정렬되지 않은 데이터를 적절한 위치에 삽입시켜 정렬하는 방식입니다. 시간 복잡도는 O(n)으로 느린 편이지만 구현하기가 쉽습니다.
삽입 정렬의 핵심 이론
선택 데이터를 현재 정렬된 데이터 범위 내에서 적절한 위치에 삽입하는 것이 삽입 정렬의 핵심입니다.
삽입 정렬 과정
1. 현재 index에 있는 데이터 값을 선택한다.
2. 현재 선택한 데이터가 정렬된 데이터 범위에 삽입될 위치를 탐색한다.
3. 삽입 위치부터 index에 있는 위치까지 shift 연산을 수행한다.
4. 삽입 위치에 현재 선택한 데이터를 삽입하고 index++ 연산을 수행한다.
5. 전체 데이터의 크기만큼 Index가 커질 때까지, 즉 선택할 데이터가 없을 때까지 반복한다.
적절한 삽입 위치를 탐색하는 부분에서 이진 탐색 (binary search) 등과 같은 탐색 알고리즘을 사용 하면 시간 복잡도를 줄일 수 있습니다.
퀵 정렬
퀵 정렬 (quick sort)은 기준값 (pivot)을 선정해 해당 값보다 작은 데이터와 큰 데이터로 분류하는 것을 반복해 정렬하는 알고리즘입니다. 기준값이 어떻게 선정되는지가 시간 복잡도에 많은 영향을 미치고, 평균적인 시간 복잡도는 O(nlogn)이며 최악의 경우에는 시간 복잡도가 O(n^2)이 됩니다.
퀵 정렬의 핵심 이론
pivot을 중심으로 계속 데이터를 2개의 집합으로 나누면서 정렬하는 것이 퀵 정렬의 핵심입니다. 다음 그림을 봅시다.
퀵 정렬 과정
1. 데이터를 분활하는 pivot을 설정한다(위 그림의 경우 가장 오른쪽 끝을 pivot으로 설정
2. pivot을 기준으로 다음 a~e 과정을 거쳐 데이터를 2개의 집합으로 분리한다.
a. start가 가리키는 데이터가 pivot 가리키는 데이터보다 작으면 start 를 오른쪽으로 1칸 이동한다.
b. end가 가리키는 데이터가 pivot이 가리키는 데이터보다 크면 end를 왼쪽으로 1칸 이동한다.
c. start 가리키는 데이터가 pivot이 가리키는 데이터보다 크고, end가 가리키는 데이터가 pivot이 가리키는 데이터보다 작으면 start, end가 가리키는 데이터를 swap하고 start는 오른쪽, end는 왼쪽으로 1칸씩 이동한다.
d. start와 end가 만날 때까지 a~c를 반복한다.
e. start와 end가 만나면 만난 지점에서 가리키는 데이터와 pivot이 가리키는 데이터를 비교하여 pivot이 가리키는 데이터가 크면 만난 지점의 오른쪽에, 작으면 만난 지점의 왼쪽에 pivot이 가리키는 데이터를 삽입한다.
3. 분리 집합에서 각각 다시 pivot을 선정한다.
4. 분리 집합이 1개 이하가 될 때까지 과정 1~3을 반복한다.
퀵 정렬의 시간 복잡도는 비교적 준수하므로 코딩 테스트에서도 종종 응용합니다. 재귀 함수의 형태로 직접 구현해 볼 것을 추천합니다.
병합 정렬
병합 정렬 (merge sort)은 분할 정복 (devide and conquer)방식을 사용해 데이터를 분할하고 분할한 집합을 정렬하며 합치는 알고리즘입니다. 병합 정렬의 시간 복잡도는 O(nlogn)입니다.
병합 정렬의 핵심 이론
다음 그림을 보며 병합 정렬을 이해해 봅시다.
부분 그룹은 setN으로 표시했습니다.
병합 정렬 수행 방식
그림을 보면 최초에는 8개의 그룹으로 나눕니다. 이 상태에서 2개씩 그룹을 합치며 오름차순 정렬합니다. 그 결과 (32, 42), (24, 60), (5, 15), (45, 90)이 됩니다. 이어서 2개씩 그룹을 합치며 다시 오름차순 정렬합니다. 그 결과 (24, 32, 42, 60), (5, 15, 45, 90)이 됩니다. 이런 방식으로 병합 정렬 과정을 거치면 (5, 15, 24, 32, 42, 45, 60, 90)이 되어 전체를 오름차순으로 정렬할 수 있습니다.
병합 정렬은 코딩 테스트의 정렬 관련 문제에서 자주 등장합니다. 특히 2개의 그룹을 병합하는 원리는 꼭 숙지해야 합니다. 다음 그림을 통해 2개의 그룹을 병합하는 원리를 알아봅시다.
2개의 그룹을 병합하는 과정
두 포인티 개념을 사용하이 왼쪽, 오른쪽 그룹을 합합니다. 왼쪽 포인터와 오른쪽 포인터의 값을 비교하여 작은 값을 결과 배일에 추가하고 포인터를 오른쪽으로 1칸 이동시킵니다. 이 방식은 여러 문제에서 응용하므로 반드시 숙지하는 것이 좋습니다.
기수 정렬
기수 정렬 (radix sort)은 값을 비교하지 않는 특이한 정렬입니다. 기수 정렬은 값을 놓고 비교할 자릿수를 정한 다음 해당 자릿수만 비교합니다. 기수 정렬의 시간 복잡도는 O(kn)으로, 여기서 k는 데이터의 자릿수를 말합니다.
예를 들어 234, 123을 비교하면 4와 3, 3과 2, 2와 1만 비교합니다.
기수 정렬의 핵심 이론
기수 정렬은 10개의 큐를 이용합니다. 각 큐는 값의 자릿수를 대표합니다. 다음 그림을 봅시다.
그림을 보면 원본 배열은 16, 80, 18, 77, 03, 24, 88, 23입니다. 그러면 일의 자릿수 기준으로 배열 원소를 큐에 집어넣습니다. 그런 다음 0번째 큐부터 9번째 큐까지 pop을 진행합니다.
그 결과 80, 03, 23, 24, 16, 77, 18, 88이 만들어집니다. 이어서 십의 자릿수를 기준으로 같은 과정을 진행합니다. 마지막 자릿수를 기준으로 정렬할 때까지 앞의 과정을 반복합니다.
기수 정렬은 시간 복잡도가 가장 짧은 정렬입니다. 만약 코딩 테스트에서 정렬해야 하는 데이터의 계수가 너무 많으면 기수 정렬 알고리즘을 횔용해 보세요.
책 <Do It! 알고리즘 코딩테스트>_김종관 지음, 이지스퍼블리싱 출판사
학교 알고리즘 수업 강의자료 등 여러 자료 참고해서 공부함.
'코딩 도구 > 글' 카테고리의 다른 글
정수론 : 소수 구하기 에라토스테네스의 채 (38) | 2024.02.16 |
---|---|
그리디 알고리즘과 우선순위 큐 (37) | 2024.02.15 |
탐색 알고리즘 정리 (41) | 2024.02.11 |
그래프의 표현 (알고리즘, 자료구조) (32) | 2024.02.10 |
프로그래밍 질문하는 법 (47) | 2024.01.29 |