119 lines
5.5 KiB
Markdown
119 lines
5.5 KiB
Markdown
|
# Řazení
|
||
|
|
||
|
Nalezení pořadí (indexů) pro množinu prvků podle nějakého uspořádání. (neplést s tříděním)
|
||
|
- jeden z nejčastějších výpočetních úkonů
|
||
|
- součást mnoha složitějších algoritmů
|
||
|
- až 30 % častu běžného počítače
|
||
|
- rychlost algoritmů se dá dobře popsat pomocí jejich výpočetní složitosti
|
||
|
|
||
|
**Dělení**
|
||
|
- **vnitřní**: jen paměťová místa, kde jsou uložená data a konstantní počet dodatečných
|
||
|
- **vnější**: používá $\Omega(n)$ dodatečných paměťových míst
|
||
|
+ **přímé**: přesouvá (řadí) samotná data (jednoduché datové typy)
|
||
|
+ **nepřímé**: přesouvá jen zástupce dat (složitější datové typy)
|
||
|
- **nestabilní**: v případě rovnosti mohou pořadí stejných prvků změnit
|
||
|
- **stabilní**: v případě rovnosti zachovává původní pořadí prvků
|
||
|
- u stabilního řazení můžeme řadit vícekrát a předchozí pořadí bude zachováno
|
||
|
+ **porovnávací**: většina algoritmů, porovnává vždy dvojici prvků
|
||
|
+ **jiné**: jen speciální případy, např. počítací řazení
|
||
|
|
||
|
**Počítací řazení**
|
||
|
- omezený počet klíčů
|
||
|
- pouze pro přímé řazení
|
||
|
- používá se k určení, **kolikrát** se vyskytuje každý klíč
|
||
|
|
||
|
## Uspořádání
|
||
|
|
||
|
- relace $\leq$ na množině všech možných prvků
|
||
|
- vlastnosti:
|
||
|
- **tranzitivní**: když A $\leq$ B a $B \leq C$, pak $A \leq C$
|
||
|
- **antisymetrická**: $A \leq B$ a $B \leq A$ jedině, když $A = B$
|
||
|
- **trichotomická**: buď $A \leq B$, nebo $B \leq A$
|
||
|
|
||
|
### Uspořádání v Javě
|
||
|
|
||
|
- reprezentováno implementací rozhraní **Comparable**
|
||
|
- A je v relaci s B právě když A.compareTo(B) $\leq 0$
|
||
|
- implementace **compareTo** musí také splňovat vlastnosti uspořádání
|
||
|
|
||
|
## Druhy řazení
|
||
|
|
||
|
**Insert sort** (řazení vkládáním)
|
||
|
- uvažuje vždy jeden prvek
|
||
|
- postupně ho posouvá na správné místo v již seřazené části posloupnosti
|
||
|
- složitost:
|
||
|
- záleží na charakteru dat
|
||
|
- v nejhorším případě $\Omega(n^2)$
|
||
|
- v průměrném případě také $\Omega(n^2)$
|
||
|
- náročné jsou prvky vzdálené od správné pozice
|
||
|
- pokud žádný prvek od své správné pozice není dále než k, kde k nezávisí na n, je složitost $\mathcal{O}(n)$
|
||
|
|
||
|
**Shell sort** (Shellovo řazení)
|
||
|
- data budou zpracovávání v několika průchodech
|
||
|
- v počátečních průchodech kontrolovány a přesouvány prvky vzdálené o krok $h > 1$
|
||
|
- délka kroku $h$ se bude postupně snižovat
|
||
|
- v posledním průchodu $h = 1$ a proces je stejný jako u insert sortu, nicméně většina prvků se bude posouvat jen o malou vzdálenost
|
||
|
- složitost:
|
||
|
- dosud se ji nepodařilo přesně zjistit, dle experimentů $\mathcal{O}(n^{1.25})$
|
||
|
- není známa ani optimální posloupnost kroků
|
||
|
- nestabilní
|
||
|
|
||
|
**QuickSort** (řazení dělením)
|
||
|
- rozdělí problém na menší podproblémy a ty dále dělí stejným způsobem
|
||
|
- končí, když je podproblém trviální
|
||
|
- přirozeně vede na rekurzivní zápis
|
||
|
- postup:
|
||
|
- vybere se pivot (např. poslední prvek) a přesune se do proměnné
|
||
|
- pole se prochází zleva a při nalezení něčeho většího než je pivot se prvek přesune na volené místo (tedy to místo posledního prvku)
|
||
|
- poté se začne procházet od konce, a postup se opakuje, dokud se indexy zleva i zprava nerovnají
|
||
|
- vlastnosti:
|
||
|
- není potřeba vyměňovat prvky (je to drahá operace)
|
||
|
- využijeme skutečné parametry left a right jako proměnné
|
||
|
- problém: nevhodný pivot
|
||
|
- ideálním pivotem je medián
|
||
|
- složitost:
|
||
|
- nejhorší případ: $\Omega(n^2)$
|
||
|
- seřazená posloupnost
|
||
|
- nejlepší případ: $\mathcal{O}(n)$
|
||
|
- medián vybrán jako první pivot
|
||
|
- očekávaný případ: $\approx 2n \in \mathcal{O}(n)$
|
||
|
- průměrný případ: $\mathcal{O}(n \log(n))$
|
||
|
|
||
|
**QuickSelect**
|
||
|
- podobný řazení dělením
|
||
|
- najde prvek v k-tém pořadí velikosti (ten který by po seřazení byl na k-tém indexu)
|
||
|
- postup:
|
||
|
- vybere se pivot
|
||
|
- interval se rozdělí podle pivotu stejně jako při řazení
|
||
|
- vybere se podinterval, ve kterém leží cílový index
|
||
|
- efektivní pro hledání mediánu či kvantilů
|
||
|
|
||
|
**Mergesort** (řazení slučováním)
|
||
|
- myšlenka: sloučení dvou posloupností je možné v lineárním čase
|
||
|
- vnější řazení (bude potřeba paměť navíc)
|
||
|
- postup:
|
||
|
- procházíme obě posloupnosti současně (držíme aktuální index pro obě)
|
||
|
- do výsledné posloupnosti zapíšeme menší ze dvou aktuálních prvků
|
||
|
- v příslušné posloupnosti se posuneme na další prvek
|
||
|
- efentivní implementace:
|
||
|
- pracuje s úseky původního pole a eliminuje testování konce polí A a B
|
||
|
- alokuje se dočasné pole
|
||
|
- v poli se vytvoří tzv. bitonická posloupnost
|
||
|
- prvky A v původním pořadí, prvky v B v obráceném pořadí
|
||
|
- z pomocného pole se prvky sloučí do původního pole
|
||
|
- složitost:
|
||
|
- $\mathcal{O}(n \log(n))$ ve všech případech
|
||
|
- paměťová složitost:
|
||
|
- $\Omega(n)$ nutná pro uložení bitonické posloupnosti
|
||
|
- ve většině implementací stabilní
|
||
|
- snadný přepis na nerekurzivní verzi
|
||
|
|
||
|
### Porovnání složitosti algoritmů
|
||
|
|
||
|
| algoritmus | nejhorší | očekávaná | paměťová |
|
||
|
| ---------- | ------------------- | ------------------- | ----------- |
|
||
|
| BubbleSort | $\Theta(n^2)$ | $\Theta(n^2)$ | $\Theta(1)$ |
|
||
|
| InsertSort | $\Theta(n^2)$ | $\Theta(n^2)$ | $\Theta(1)$ |
|
||
|
| ShellSort | $\Theta(n^{3/2})$ | $\Theta(n^{1.25})$? | $\Theta(1)$ |
|
||
|
| QuickSort | $\Theta(n^2)$ | $\Theta(n \log(n))$ | $\Theta(1)$ |
|
||
|
| MergeSort | $\Theta(n \log(n))$ | $\Theta(n \log(n))$ | $\Theta(n)$ |
|