Chapter 11: Recursion and matrices

Rekurze je technika, při které funkce opakovaně volá samu sebe (přímá rekurze) - případně se mohou dvě funkce volat navzájem (nepřímá rekurze). Přitom je nutné, aby tato opakovaná volání měla konečný počet - v tom případě se jedná o konečnou rekurzi.

Pokud by rekurzivní volání nenarazilo na základní případ, šlo by o nekonečnou rekurzi s neúměrným nárokem na paměť počítače.Tato situace je ošetřena tak, že se Python zastaví po dosažení nastavené hloubky rekurze (implicitně ~ 1000 až 3000 cyklů - v závislosti na typu paměti RAM počítače) a vrací chybu při běhu programu.

Příbuznou procedurou jako rekurze je iterace (viz Kap. 3.1), která je méně náročná na paměť a je rychlejší než rekurze.

n_i	n_i - 1	n_i > 0	print(n_i)	Poznámka
4	3	T	4
3	2	T	3
2	1	T	2
1	0	F	1	cntdwn (4) --> 4 3 2 1

Stojí za pozornost, že varianta funkce cntdwn(n) s jinak umístěnými řádky vrátí jiný výsledek:

Časté je použití příkazu return. Zde je přehlednější obdoba (s jinou podmínkou) funkce ctdn:

Není snadné se v tom vyznat. Ve čtyřech uvedených příkladech velmi podobné rekurzivní funkce jsme viděli dva různé výstupy. Proč tomu tak je, souvisí se zákulisní aktivitou interpreta a paměti typu stack (zásobník) s procedurou FIFO (first in, first out).

11.1.2 Faktoriál

V matematice známý pojem faktoriál čísla n (n!) je označení pro součin souvislé číselné řady 1 až n: n! = n * (n-1) * (n-2) * ... *1
Ukážeme si jeho různé vyjádření:

11.1.3 Fibonacci

Fibonacciho sekvence

Fibonacciho sekvence je řada čísel 0 ÷ n, v níž každé číslo je součet dvou čísel předcházejících:

Fibonacciho číslo

Opakovaný výpočet pomocí rekurze bývá pomalejší než výpočet pomocí iterace, protože zabírá více místa v paměti.
Koncová rekurze je v Pythonu považována za špatnou techniku, protože používá více systémových zdrojů než ekvivalentní iterativní řešení. Volání fibonacci(500) uvede interpreta Pythonu do rozpaků.

Mnohem rychlejší než rekurzivní verze je verze iterační, která by mohla vypadat takto:

Vyzkoušejte volání fibo_iter(500) a budete příjemně překvapeni.
V dalším odstavci si ukážeme memoizovanou alternativu funkce fib_iter, která je ze všech tří verzí nejrychlejší.

11.1.4 Memoizace

Když jsme si v předchozím odstavci pohrávali s výpočtem Fibonacciho čísla, mohli jsme si všimnout, že čím větší argument jsme použili, tím déle trvalo provádění výpočtu. Se zvětšujícím se argumentem časové nároky velmi rychle rostly.

Abychom pochopili proč, pohleďme na toto schéma volání funkce fibonacci(4):

Schéma zobrazuje sadu funkcí v rámečcích se šipkami, ukazujícími na volané funkce. Nejvýše umístěná fce, fibonacci(4) volá fibonacci(3) a fibonacci(2). Fce fibonacci(3) zas volá fibonacci(2) a fibonacci(1). A tak dále.

Spočítejme, kolikrát je voláno například fibonacci(0). Opakovaný výpočet hodnoty funkce pro tentýž argument je řešení neefektivní a rychle se zhoršuje při zvětšující se hodnotě argumentu.

Dobrým řešením, zvaným memoizace (memoization), je ukládat si záznamy o spočítaných hodnotách do slovníku pro potřebu dalšího použití. Takovýmto záznamům říkejme třeba memo. Zde vidíme realizaci funkce fibonacci s podporou náznaků:

Slovník memo zaznamenává fibonacciho čísla, která již známe. Začínáme pouhými dvěma páry: 0 ukazuje na 0, 1 na 1.

Kdykoli je funkce fibo_mem volána, prozkoumá svůj slovník, zda neobsahuje výsledek. Jestliže ano, vrací výsledek bez dalších okolků. Jestliže ne, počítá novou hodnotu. Tato hodnota je přidána do slovníku před tím, než se funkce vrátí k rekurzivnímu volání.

S použitím této verze náš počítač spočítá fibo_mem(30) v jednom oka mžiku, fibo_mem(40) už trvá asi minutu.

Výrazné zlepšení výpočtu Fibonacciho čísla pomocí memoizace představuje výpočet s podporou dekorátorů (kap.10.8).

11.1.5 Vnořené seznamy

K vytvoření součtu všech čísel v seznamu s vnořeným seznamem potřebujeme traverzovat seznamem, navštívit každou položku uvnitř vnořené struktury a připočítávat číselné hodnoty k našemu součtu.

Potřebný program pro vytvoření součtu čísel v seznamu s vnořeným seznamem je díky rekurzi překvapivě krátký:

Tělo fce se skládá hlavně ze smyčky for, která traverzuje seznamem nested_num_list. Je-li položkou seznamu numerická hodota nikoliv seznam (větev else), přičte se číslo jednoduše k proměnné sum. Je-li položkou seznam, potom je opět volána fce recursive_sum pro argument, jímž je vnořený seznam. Příkaz uvnitř těla funkce, jímž je volána táž funkce, se nazývá rekurzivní volání.
Funkce je napsána pouze pro hodnoty typu int, což vyplývá z počátečního stavu počítadla.

Poněkud komplikovanější úlohou je nalezení největší hodnoty v seznamu s vnořeným seznamem. Následující definice funkce obsahuje doctest (viz kap. 6.12), kterým si jednak ilustrujeme řešený problém a zároveň ověříme správnost naší funkce:

Jak je u doctestů [ne]dobrým zvykem, reakcí na správný výsledek při průběhu kódu je němé mlčení jako v našem případě. O tom, že náš prográmek chodí správně se přesvědčíme, když se zeptáme přímo:

Čertovým kopýtkem našeho problému je určení numerické hodnoty pro inicializaci proměnné largest. Nemůžeme jednoduše zadat, že je to nested_num_list[0], protože by touto položkou mohlo být jak číslo, tak seznam. Problém je řešen použitím smyčky while, která přiřadí proměnné largest první číselnou hodnotu bez ohledu na hloubku jejího vnoření.

11.2 Matice

Práce s maticemi vyžaduje specifické znalosti maticového počtu. Na rozdíl od algebry v něm například obecně neplatí komutativní zákon pro součin, jenž však platí pro součet (rozdíl) c = a + b = b + a kde c_i,j = a_i,j + b_i,j.
Z toho vyplývá, že obě matice musí mít stejný rozměr

Násobení matice a o velikosti m (řádků) * n (sloupců) maticí b o velikosti n (řádků) * p (sloupců) je možné v případě, že počet sloupců n matice a souhlasí s počtem řádků n matice b. Rozměr výsledné matice je m * p.

Pokud je tato podmínka splněna, lze prvek c_i,j matice c = a * b určit jako algebraický součet součinů prvků z i-tého řádku matice a s prvky z i-tého sloupce matice b, jak je naznačeno v následném schematu:

Rozměr výsledné matice c = a * b je tedy dán počtem řádků m matice a a počtem sloupců n matice b.

11.2.1 Matice jako seznam

K vyjádření matic se často používají vnořené seznamy. Například, matice o rozměru 3x3 (3 řádky x 3 sloupce):

může být vyjádřena jako seznam s vnořenými seznamy stejné délky. Jednotlivé vnořené seznamy prezentují příslušné řádky matice:

V maticovém počtu lze tyto vnořené seznamy označit jako řádkové matice, neboli vektory.

Řádek matice vybereme jako prvek vnějšího seznamu (indexy zde počínají nulou):

Výpočet součinu matic lze provést trojím použitím idiomu for i in range(len(...)):

Sevřenější tvar má toto řešení s komprehencí seznamu a s vestavěnými funkcemi sum a zip:

Práci s maticemi ulehčuje modul NumPy Ten je však v Thonny nedostupný a musíme použít aplikaci IDLE.

11.2.2 Matice jako slovník

Matice jako seznam seznamů je dobrý způsob pro matice s převážně nenulovými hodnotami, uvažme však řídkou matici jako je tato:

Alternativou je použití slovníku. Jako klíče můžeme použít entice, obsahující pořadová čísla řádků a sloupců. Zde je slovníkové vyjádření téže matice:

Tento problém řeší metoda get. Prvním argumentem je souřadnice místa, druhým argumentem je univerzální nula:

11.3 Chyby a výjimky

Jak už bylo uvedeno v první kapitole, mohou se při kontrole zdrojového kódu kompilací vyskytnout chyby skladebné (syntaktické) a při interpretaci objektového kódu za běhu programu (run-time) takzvané chyby výjimkové, neboli výjimky (exceptions).
Při výskytu těchto událostí dojde k zastavení výpočtu a případně k poskytnutí stručné informace o (možné) příčině události - viz výpis chybové sekvence, zvaný traceback.

Příklad chyby skladebné

Při výskytu takovéto chyby se zastaví běh kompilace a zobrazí se informace s označením místa na řádku, kde k chybě došlo (^)

Příklad výjimkové události

Při výskytu předpokládané výjimky (např. dělení nulou) zastaví Python běh programu a pokusí se zobrazit informaci o vzniklé chybě:

Poznámka: Výjimky jsou definovány jako instance třídy, odvozené od třídy BaseException. Úplný výpis vestavěných výjimek Pythonu lze nalézt v dokumentaci Built-in Exceptions.

11.3.1 Traceback

Traceback je výpis chybové sekvence, který ukazuje sled volání funkcí vedoucích k chybě, například:

11.3.2 Vlastní výjimky

Kromě standardních (built-in) výjimek je možné používat vlastní výjimky a to deklarací:

Ověření správnosti uživatelem zadaného výrazu lze také zajistit předsazeným příkazem assert:

Použití příkazu assert je výhodné při ladění (debugging) kódu, tedy při vyhledávání potenciálně chybujícího místa kódu.
Příkaz assert je vhodný pro jednoduché ověření přijatého údaje:

11.3.3 Ošetření výjimek

Chceme-li zařídit aby provádění programu pokračovalo i po výskytu určité chyby, provedeme takzvané "ošetření výjimky" (exception handling).
To zpravidla spočívá v použití klauzule try v kombinaci s klauzulemi assert, except, else či finally s následujícími významy:

Klauzulí assert a except může být v případě potřeby více, případně se jedna klauzule může vztahovat na více výjimek.
Klauzule assert je neaktivní, použije-li se při spuštění programu flag -o nebo je příponou souboru ~.pyv (místo ~.pyc).

Kombinaci try, except, else lze použít spolu s deklarací třídy pro ošetření vlastní výjimky, jíž v tomto případě je zadání krátkého hesla:

Jak vidno, naše třída dědí z vestavěné třídy Exception. K použití deklarované třídy dochází při (opětovné) evokaci celého bloku kódu v aplikaci IDLE či Thonny:

11.4 Kopírování objektů

Účelem kopírování je vytvoření nezávislé, autonomní kopie objektu. Tuto kopii lze provést jako mělkou (shallow) nebo důkladnou (deep).

Rozhodující vlastností kopírovaného objektu je jeho složení. Jednoprvkový objekt nebo jednoduché prvky kontejneru (list, tuple, set, dict) lze nezávisle reprodukovat jako shallow copy. Kontejner s vnořenými složenými prvky lze nezávisle reprodukovat pouze jako deep copy.
Za kopii nelze považovat přiřazení téhož objektu k více proměnným - viz alias.

11.4.1 Zdánlivá kopie

Zdánlivou kopii neboli alias vytvoříme přiřazením téhož objektu k více jménům, což lze provést najednou v jednom řádku:

Proměnné se shodnými ID odkazují na stejný objekt. Změny objektu provedené prostřednictvím jednoho aliasu se projeví i u dalšího aliasu:

11.4.2 Mělká kopie

Při mělké (shallow) kopii se v možném rozsahu vytvoří nový samostatný klon originálu. Mělkou kopii můžeme provést čtverým způsobem - například pro seznam:

Ve všech čtyřech uvedených případech se nezávisle kopírují pouze jednoduché členy kopírovaného seznamu. Prvky vloženého seznamu jsou závisle propojeny se svým originálem:

11.4.3 Důkladná kopie

Při důkladné (deep) kopii složeného objektu se vytvoří nový složený objekt, do něhož se vkládají nezávislé kopie objektů, nalezených v originálu.
Důkladnou kopii vytvoříme importovanou metodou deepcopy z modulu copy:

11.5 Modul pydoc

Modul pydoc použijeme k prohledávání knihoven Pythonu, instalovaných na počítači. Na příkazový řádek konzoly napíšeme:

Příkaz spustí libovolný nepoužitý port v počítači a otevře stránku ve webovém prohlížeči. Seanci serveru ukončíme příkazem q (quit) v konzole.

Je to výčet všech knihoven Pythonu na vašem počítači. Klikem na jméno modulu otevřeme novou stránku s dokumentací o vybraném modulu. Například, klik na slovu keyword (v 5. červeném poli) otevře následující stánku:

Dokumentace pro většinu modulů obsahuje až tři barevně označené sektory:

Modul keyword obsahuje jedinou funkci iskeyword, která - jak její jméno naznačuje - je booleovskou funkcí, vracející True je-li zadaný řetězec klíčovým slovem:

Datový prvek kwlist obsahuje seznam všech současných klíčovych slov Pythonu:

Doporučujeme časté používání služby pydoc ke zkoumání rozsáhlých knihoven Pythonu. Mnoho pokladů čeká na své objevení!

11.6 Cvičení

Napište funkci recursive_min, která vrátí nejmenší číselnou hodnotu seznamu s vnořenými seznamy:

def recursive_min(nested_num_list):
    """
    >>> recursive_min([2, 9, [1, 13], 8, 6])
    1
    >>> recursive_min([2, [[100, 1], 90], [10, 13], 8, 6])
    1
    >>> recursive_min([2, [[13, -7], 90], [1, 100], 8, 6])
    -7
    >>> recursive_min([[[-13, 7], 90], 2, [1, 100], 8, 6])
    -13
    """

Funkce by měla vyhovět všem doctestům.

Napište funkci recursive_count, která vrátí počet výskytů číselné hodnoty target v seznamu nested_number_list:

def recursive_count(target, nested_num_list):
    """
    >>> recursive_count(2, [2, 9, [2, 1, 13, 2], 8, [2, 6]])
    4
    >>> recursive_count(7, [[9, [7, 1, 13, 2], 8], [7, 6]])
    2
    >>> recursive_count(15, [[9, [7, 1, 13, 2], 8], [2, 6]])
    0
    >>> recursive_count(5, [[5, [5, [1, 5], 5], 5], [5, 6]])
    6
    """

Funkce vyhoví všem doctestům?

Napište funkci flatten, která vrátí jednoduchý seznam, obsahující všechny honoty z nested_number_list:

def flatten (nested_num_list):
    """
    >>> flatten([2, 9, [2, 1, 13, 2], 8, [2, 6]])
    [2, 9, 2, 1, 13, 2, 8, 2, 6]
    >>> flatten([[9, [7, 1, 13, 2], 8], [7, 6]])
    [9, 7, 1, 13, 2, 8, 7, 6]
    >>> flatten([[9, [7, 1, 13, 2], 8], [2, 6]])
    [9, 7, 1, 13, 2, 8, 2, 6]
    >>> flatten([[5, [5, [1, 5], 5], 5], [5, 6]])
    [5, 5, 1, 5, 5, 5, 5, 6]
    """

Napište funkci readposint(), která vyzve uživatele k zadání kladného celého čísla a to případně opakovaně, dokud není zadána korektní vstupní hodnota.
V ukázce se zadávanou hodnotou 'spin' nám procedura chodí korektně jen pro jeden chybný vstup, "což není to pravé ořechové".
Pro ověření správnosti uživatelského vstupu použijte mechanizmus ošetření výjimky.
Přepište funkci factorial(n) s použitím iterace místo rekurze. Volejte svou funkci pro argument 1000 a změřte jak rychle vrátí výsledek.
Upravte první příklad (try_spin_int.py) v odstavci Ošetření výjimek tak, aby procedura reagovala i na "šle".

11. Rekurze, matice a různé

11.1 Rekurze

11.1.1 Povšechný úvod