Scheme

Z Multimediaexpo.cz

Scheme je multiparadigmatický programovací jazyk. Funkcionální programovací paradigma patří mezi tzv. deklarativní paradigmata. Scheme je jeden ze dvou hlavních dialektů funkcionálního programovacího jazyka Lisp. Jazyk navrhli Guy Lewis Steele a Gerald Jay Sussman a jeho první popis byl sepsán v roce 1975. Scheme byl představen akademickému světu skrze sérii článků, nyní známých jako Sussmanovy a Steelovy Lambda Papers[1] . Jazyk Scheme definují dva standardy: oficiální IEEE standard a standard nazývaný Revisedn Report on the Algorithmic Language Scheme, ve zkratce RnRS, kde n je číslo revize. Současný standard je R5RS[2], a R6RS[3] je ve vývoji.

Oproti Lispu se Scheme snaží o minimalismus - poskytovat co nejmenší počet základních funkcí, na nichž jsou pak v knihovnách postaveny složitější konstrukce. Díky tomu má dosud poslední reference jazyka jen 50 stran.

Scheme byl prvním dialektem Lispu, který nabízel volbu mezi lexikálním nebo dynamickým rozsahem platnosti proměnné. Také byl jedním z programovacích jazyků, který podporoval „first-class continuation“.

Tento jazyk je v praxi používaný jen zřídka, používá se především ve školách pro výuku programování algoritmů. Nejznámější implementací je grafický editor GIMP, jehož dodatečné zásuvné moduly a skripty jsou psány v dialektu jazyka Scheme.

Obsah

Původ

Na počátku zrodu jazyka Scheme stála potřeba Guye Steela a Geralda Sussmana z MIT (Massachussetský technický institut), vyzkoušet si některé aspekty modelu aktorů, který v roce 1973 veřejnosti představil Carl Hewitt. Protože LISP se k tomuto příliš nehodil, bylo potřeba navrhnout nový jazyk. Ten byl nakonec implementován v LISPu. A dokonce i syntaxí LISP hodně připomínal. Byl však o dost jednodušší, a odstraňoval některé z nepříjemných vlastností LISPu.

"Chceme lépe porozumět Hewittovu Aktor modelu, ale máme problémy vztáhnout aktor model a jeho neobvyklou terminologii známých programových notací. Plánovali jsme zkonstruovat ukázkovou implementaci aktor jazyka tak, abychom si sní mohli hrát. Použitím MacLisp, jakožto pracovního prostředí, jsme napsali tenký interpret Lispu a poté přidali mechanismus k vytváření aktorů a posílání zpráv.„

Poprvé byl jazyk Scheme veřejně popsán v roce 1975 v práci Sussmana a Steela “ Scheme: an interpreter for extended lambda calculus". V roce 1976 pak Sussman a Steele napsali dvě publikace "LAMBDA: The Ultimate Imperative" a "LAMBDA: The Ultimate Declarative", v nichž popsali, jak řešit běžné programové konstrukce.

V roce 1978 byl jazyk Scheme standardizován. Základem se stala "Revidovaná zpráva o Scheme" - dialektu LISPu. Tato zprava popisovala vývoj jazyka, poté co byla MIT implementace rozšířena o podporu inovativního kompileru. Další zpráva, která byla nazvána "Revize revize reportu Scheme, neboli neobvyklý LISP" byla publikována v roce 1985. Tradice revizi revize revize se zachovala a dnes je jiz na světě poslední pátá revize z února roku 1998.

Původní název jazyka byl Schemer. Po vzoru dobových jazyků pro umělou inteligenci Planner a Conniver. Protože však autoři používali operační systém ITS, který limitoval délku souborů a adresářů šesti znaky, byly vždy soubory pro Schemer uloženy v adresáři Scheme. Z tohoto název Scheme, který tak nahradil Schemer.

Budoucnost

Nový standardizační proces začal na 2003 Scheme workshopu, s cílem vytvoření R6RS standardu v roce 2006. R6RS přinese standardní modulární systém; povolí dělit mezi jádrem jazyka a knihovnami. Koncept R6RS specifikace (žertovně pojemovaný "R5.91RS") byl uvolněn k testování v říjnu 2006. Aktualizovaný koncept, R5.92RS, byl uvolněn 19. ledna 2007, a další, R5.93RS, 22.března 2007. Poslední koncept je R5.95RS a byl uvolněn 25. června 2007.

Ukázka kódu

Tradiční program hello world vypadá v jazyce Scheme třeba takto:

"Ahoj svete!"

Na prvním řádku začíná definice procedury hello, která vypíše text „Ahoj svete!“ a odřádkuje. Na čtvrtém řádku je pak tato procedura zavolána.

Příkaz define slouží také k definici proměnných:

 

Následující příklad ukazuje definici funkce, která vypočítá faktoriál zadaného čísla:

 

Psaní konstrukce lambda může být zdlouhavé, a tak Scheme nabízí zkratku:

 

Funkci pak lze zavolat:

 

Na výstupu bychom dostali číslo 24. Výše uvedený příklad ukazuje několik zajímavých konstrukcí. Jednak je zřejmé, že v jazyce Scheme se používá prefixového zápisu:

; součet
; rozdíl
; součin
; podíl
; není třeba se omezovat na dvě čísla

Druhou zajímavou věcí je podmínka if. Ta má tvar (if (výraz) true false), kde větev true se provede, je-li výraz pravdivý (není-li vyhodnocen jako #f), větev false v případě, že je výraz nepravdivý (#f; ekvivalentní části else v jiných jazycích).

Třetí zajímavou věcí je rekurzivní volání sebe sama na pátém řádku definice funkce. Funkci pro výpočet faktoriálu lze přepsat:

 

V takovém to případě budou všechna rekurzivní volání koncově rekurzivní. Průběžné hodnoty nejsou ukládány na zásobník, ale jsou předávány jako argumenty rekurzivní funkce a interpret, může zahodit obsah zásobníku a znovu zavolat funkci. Tzn. že výpočet funkce probíhá v konstantní paměťovém prostoru. Standard jazyka Scheme R5RS, přesně definuje, kdy dojde ke koncovému volání. V ukázce kódu je také použitá konstrukce „pojmenovaný let“, která se používá na vytvoření rekurze v těle funkce bez toho, aniž bychom explicitně definovali funkci v globálním prostředí.

Elementy jazyka

Komentáře

Každý komentář je uvozen středníkem (;) a je platný po celý zbytek řádku. Některé implementace dovolují zakomentovat více řádků, obalí-li se do #|…|#.

Identifikátory

  • extrémně volná pravidla;
  • mohou obsahovat:
    • písmena a–z, A–Z ;
    • číslice;
    • znaky ? ! . + – / < = > : $ % ^ & _ ~
  • nesmí obsahovat závorky;


příklady:

 x3, prumerny-plat, Maximum, ?$*

Konvence pro identifikátory

  • jména predikátů (vracejí pravdivostní hodnotu) končí otazníkem, např. number?;
  • jména procedur s vedlejšími efekty (např. změna hodnoty nějaké proměnné) končí vykřičníkem, např. pridej-prvek!;
  • procedury konvertující jeden typ na druhý bývají pojmenovány typ1->typ2.

Čísla

  • celá: 160, +24, –78;
  • racionální (zlomky): 1/2, –29/30;
  • s plovoucí řádovou čárkou: 3.14, .33, –7.689e4;
  • komplexní: 3+2i;
  • nemá přísnou typovou kontrolu ani typované proměnné, výpočet může kombinovat několik typů.

Řetězce

Řetězce jsou uzavřeny do dvojitých uvozovek: "ahoj světe".

Pravdivostní hodnoty

  • true a false zapisovány jako #t a #f
  • revidovaná specifikace umožňuje místo #f používat ve stejném významu i prázdný seznam ()

Dvojice

Základem jazyka Scheme jsou tečkové páry. Je to (jediná) složená datová struktura s konstruktorem cons a selektory car a cdr [kudr]. Tečkový pár může například reprezentovat 2D souřadnice, imaginární číslo, nebo české a cizí slovo ve slovníku.

 

Seznamy

Seznamy jsou definovány rekurzivně pomocí dvojic. Každý seznam je definován jako posloupnost tečkových párů, přičemž poslední tečkový pár má na své druhé pozici prázdný seznam.

 

Mohou obsahovat atomické hodnoty i další seznamy. Lze je vnořovat : ((1) (2 (3 4) 5 6) 7 ((8))). Všechny seznamy mají konečnou délku a jsou ukončeny prázdným seznamem.

  • prázdný seznam je reprezentován konstantami nil, ()
    • seznam s jedním prvkem: (cons 1 () )
  • neprázdný seznam je dvojice hlava (první prvek) a ocas (seznam zbylých prvků), anglicky head a tail
    • uzavřen do závorek, prvky oddělovány mezerami: (a b c), (12 "šroubek" .8)
  • procedura list: konstrukce seznamu, s proměnným počtem argumentů.
 

K přistupování k hodnotám v seznamu slouží funkce car a cdr.

  • car - vrací první prvek v seznamu (hlavičku), seznam musí být nenulový;
  • cdr - vrací zbytek seznamu (ocásek), pokud seznam obsahuje jediný prvek, vrací prázdný seznam;
  • příklad: zisk třetího prvku seznamu: (car (cdr (cdr x))).

Procedury pro seznamy

  • (list? x) je x seznam?
  • (pair? x) je x pár?
  • (null? x) je x prázdný seznam?
  • (list operandy) vyhodnotí operandy a vytvoří seznam obsahující výsledky vyhodnocení
    • (list 6 (* 3 5) 'a) vytvoří seznam (6 15 a)
  • (length seznam) počet prvků seznamu
  • (append seznam1 seznam2 seznam3 …) spojí seznamy do jednoho
  • (reverse seznam) obrátí pořadí prvků v seznamu

Další ukázky práce se seznamy

;odstraneni prvniho vyskytu prvku ze seznamu
;odstrani vsechny vyskyty prvku ze seznamu
;; vrátí n-tý prvek ze seznamu
;; nehlídáme přitom, zda je index mimo seznam
;; N-tý prvek pole včetně kontroly, zda nejsme mimo index
;; Reagovat můžeme jakkoliv -- vrátit specifickou chybu nebo třeba prázdný seznam.
"Index je mimo seznam";spojeni seznamu - vzdy prvni prvek s prvnim
;; Možná implementace funkce map beroucí pouze jeden seznam
; Vrátí: (-1 -2 -3 -4 -5 -6)

Proměnné

  • dynamicky typované
  • uvozeny výrazem define.
 

Výraz define modifikuje vazbu symbolu v aktuálním prostředí. Oproti tomu speciální forma let vytváří nové prostředí (scope) a v tomto prostředí navazuje na symboly nové vazby. let jako takový nedokáže přepsat již exitující vazbu, vždy pouze vytváří nová prostředí. To je hlavní rozdíl oproti speciální formě define, který dokáže přepsat existující vazby.

; scope of var1
    ...)

Rozdíl mezi let a define můžeme zčásti ilustrovat na následujícím příkladu:

 

První let vytvoří své prostředí, ve kterém naváže na a hodnotu 10. Druhý let také vytvoří prostředí a naváže na a hodnotu 20. Pokud bychom nepoužili define, byl by výsledkem operace tečkový pár 20 . 10, protože sice existují dva smyboly a, ale v jiných prostředí, kde mají vlastní vazbu. define ale modifikuje vazbu v aktuálním prostředí, takže ve vnořeném vnitřním letu změní vazbu symbolu a na třicet. Výsledkem operace tak bude tečkový pár 30 . 10.

let je pouze konvenční syntaxe, která není nezbytná a může být přímo nahrazena použitím procedury. Například kód výše je přímým ekvivalentem zápisu:

; scope of var1
 

Procedury

 

Procedury jsou ve Scheme first-class objekty. Můžou být argumenty jiných procedur a mohou být jinými procedurami vraceny. Mohou být přiřazeny do proměnné. Procedury jsou tvořeny lambda formami. Například procedury se dvěma argumenty arg1 jsou definovány na řádku 1, řádek 2 je kratší, ekvivalentní výraz. Řádek 3 ukazuje jak jsou procedury spouštěny. Na prvním místě je název procedury a zbytkem jsou její argumenty.

V Scheme jsou procedury rozděleny do dvou základních kategorií: uživatelské procedury a primitiva (primitivní procedury). Všechna primitiva jsou procedury, ale ne všechny procedury jsou primitiva. Primitiva jsou předdefinové funkce jazyka Scheme. To zahrnuje např. +, -, *, /, set!, car, cdr, a další. V různých variacích Scheme může uživatel redefinovat primitivum. Příklad:

 

nebo jednoduše

 

což způsobí, že + primitivum provede rozdíl namísto součtu.

Cykly

Cykly ve standardu Scheme neexistují, ale v různých implementacích se můžeme setkat například s cyklem do. Ačkoliv programujeme-li funkcionálně, cykly nevyužijeme, protože jsou založené na vedlejším efektu. Častěji se používá rekruze. Syntaxe cyklu do je následující:

 

Nejdříve následuje seznam proměnných, které budou iterovat, včetně výchozí hodnoty a indikátoru změny po každé iteraci. Jako druhý argument je uvedena ukončující podmínka cyklu. Ve chvíli, kdy je splněna, je cyklus ukončen. Následuje seznam příkazů, které se mají v cyklu provést. Příklad jednoduchého cyklu, který vytiskne čísla od jedné do devíti:

 

Příklad cyklu procházející seznam:

 

Rovnost

Scheme rozlišuje tři druhy rovnosti: "eq?" vrací #t jestliže jeho parametry reprezentují stejné datové objekty v paměti; "eqv?" je to samé jako eq?, ale zachází s některými objekty (např. znaky a čísly) speciálně tak, že čísla, která jsou si = jsou také eqv? pouze když nejsou eq?; equal? porovnává dtové struktury jako seznamy, vektory, řetězce k zjištění, že mají stejnou strukturu a eqv? obsah.

V Scheme dále existují: string=?; porovnání řetězců; char=? porovnání znaků; = porovnání čísel

Řídící struktury

Vyhodnocování podmínek

Pro vyhodnocování podmínek nabízí Scheme tři speciální formy. If, case a cond. If se až na formu zápisu nijak neliší od if, které používá většina ostatních jazyků. Forma cond dovoluje použít libovolné množství podmínek a návratovou hodnotu pro každou z nich. Forma case je podobná formě cond postupně vyhodnocuje seznamy a pokud nalezne odpovídající prvek, vrátí jeho příslušnou hodnotu.


Použití if:

 

Výraz test je vyhodnocen takto: jestliže výsledek vyhodnocení je „true“ (což je něco jiného nežli #f), pak je vyhodnocen výraz then-expr, jinak else-expr.

Použití cond:

 

První výraz, který bude true, bude vyhodnocen, jestliže všechny výsledky jsou #f, pak je vyhodnocena else klauzule.

Vstup/Výstup

Scheme užívá konceptu portů pro čtení a zápis. R5RS definuje dva defaultní porty, přístupné pomocí funkcí current-input-port a current-output-port, což koresponduje s Unixovými pojmy stdin and stdout. Mnoho implementací poskytuje též current-error-port.

Makra

Scheme zná makra, což je velice mocná zbraň v rukou programátora. Makra tranformují zdrojový kód, makroexpanzi provádí preprocesor a samotný interpret už žádná makra nevidí, vidí pouze hotový zdrojový kód, který je určen ke zpracování. Pomocí maker si programátor může dovolit různé věci, které by jinak nebyl schopný provést. První příklad bude anaforický if, který se chová podobně jako klasický if, pouze si výsledek podmínky uchovává do symbolu it, takže v těle anaforického ifu se můžeme lehce odkázat na výsledek podmínky:

;; Příklady použití
; 10
; (3 4 5 6)

Další příklad je makro dolist, které provádí iteraci přímo nad seznamem. Bere jako argument iterační symbol, do kterého se bude vždy ukládat hodnota aktuálně procházeného prvku seznamu, seznam samotný a pak tělo.

;; Příklady použití
 

V příkladu také vidíme funkci gensym, která slouží ke generování náhodných proměnných, ke kterým nemá uživatel přístup. Slouží to k ochraně před tzv. „symbol capture“, což nastává v případě, kdy makro potřebuje nějakou vnitřní pomocnou proměnnou. Pokud bychom nepoužili náhodný symbol, mohl by uživatel k tomuto symbolu přistupovat. Špatně definované makro dolist by mohlo vypadat takto:

;; Příklad volání, kdy pocítíme symbol capture
; Vrátí: (1 2 3 4)(2 3 4)(3 4)(4) Přičemž by to mělo zobrazit chybu na neexistující symbol.

Příklady dalších užitečných maker:

;; Makro when se chová podobně jako if, pouze nemá žádnou else větev. 
;; V případě, že podmínka není splněna, automaticky vrátí false.
;; True větev ale může obsahovat více výrazů.
; Příklady použití:
; 2
; 12
; #f
 
 
;; Makro unless se chová opačně než makro when — neguje podmínku.
;; True větev se tudíž provede, není-li splněna předaná podmínka.
;; Prakticky to lze přepsat jako (when (not <podmínka>) ...).
; Příklady použití:
; #f
; #f
; 510

Hezkým příkladem jsou také podmíněné výrazy pracující s pravděpodobností. Například klasický if upravený tak, že namísto podmínky přebírá pouze procentuální vyjádření pravděpodobnosti, zda se provede true větev.

; Příklady použití:
; (V 80 % případů se vrátí jednička, ve 20 % dvojka.)
 

Streamy

Pomocí maker můžeme také realizovat líné vyhodnocování, kdy se veškeré argumenty funkcí budou vyhodnocovat líně, tj. až když budou třeba. Díky tomuto můžeme naprogramovat if jako funkci. Líného vyhodnocení využijeme i při implementaci Streamů. Stream bude tvořen tečkovými páry, ale s tím rozdílem, že bude mít vyhodnocen pouze car část, nikoli cdr. To realizujeme tím způsobem, že cdr část uložíme jako proceduru, kterou vyhodnotíme až při volání cdr streamu:

; Příklady použití
 

Pomocí makra delay jsme odložili vyhodnocení výrazů (print 100) (newline) (* 50 50) až do chvíle, kdy jsme to opravdu potřebovali — když jsme zavolali (d). Zbytek už nadefinujeme snadno:

 

A nyní už jen aplikace streamů:

;; Vrací nekonečný proud jedniček
;; Vrací nekonečný proud přirozených čísel
 

Související články

Reference

  1. The Original 'Lambda Papers' [online]. . Dostupné online.  
  2. R5RS Revised5 Report on the Algorithmic Language Scheme [online]. 2007-6-25. Dostupné online. (anglicky) 
  3. R6RS R6RS.org [online]. . Dostupné online.  

Externí dokazy