Slovenske hiše

V petem razredu spoznavamo slovenske pokrajine, del tega so tudi tipične hiše. Učno uro je najbolj primerno uporabiti za utrjevanje znanja.

Učenci bodo na začetku razporejali kartice s slikami hiš. Ta korak bi lahko preskočili - podatke bi lahko vnašali neposredno v računalnik. Vendar priporočamo uporabo kartic: aktivnost s tem ni le zanimivejša, temveč si bodo tako najbrž vzeli tudi več časa, primerjali hiše med seboj…

Primer uvodne motivacije

Pri poskušanju ure v šoli smo za začetek pokazali učencem sliko črnske vasi in za sveto zatrjevali, da smo jo sami posneli v bližini Kamnika.

Ko so učenci dovolj časa ugovarjali, smo priznali, da smo si to izmislili in pokazali dve drugi sliki, ki naj bi bili v resnici iz Kamnika. (Na levi je menda očitno v ozadju Velika planina.)

(Vir slik: Wikipedia)

Ena od učenk je na drugi sliki prepoznala Mongolijo. Tako smo se lahko pogovarjali o tem, zakaj v Mongoliji živijo v šotorih - učenci v četrtem razredu so bili dovolj razgledani, da so vedeli, da gre za nomadski slog življenja, ki zahteva pogoste selitve, ko je okolica popašena. Dodali smo, da večina Mongolcev dandanes vendarle živi v mestih in grajenih hišah, tako kot tudi večina Afričanov ne živi več v kolibah. Tako smo prišli do izhodišča: so tudi Slovenci včasih gradili hiše, ki so se od pokrajine do pokrajine razlikovale glede na podnebne razmere, dostopne materiale in način življenja?

Podatki in opis naloge

Če želimo, lahko že zdaj z računalnikom pokažemo slike, ki jih bodo razvrščali učenci in podatke, povezane z njimi. Slike dobite v primeru arhiva.

Za začetek povežemo le Datoteka in Pregledovalnik slik. V Pregledovalni slik vidimo vse slike hiš. Lahko jih povečamo (z drsnikom Velikost slike ali tako, da izberemo sliko in pritisnemo preslednico) in morda ponavljamo lastnosti hiš.

Nato lahko pokažemo, da za vsako sliko vemo, kje v Sloveniji je bila posneta: podatke iz Datoteka povežemo v Zemljevid. Barvo točk nastavimo na “vrsta hiše”. Zemljevid nam zdaj kaže točke, na katerih so posnete slike, barva pa ustreza vrsti.

Zemljevid lahko povežemo s Pregledovalnikom slik. Ko zdaj kliknemo na katero od točk (ali z risanjem pravokotnika izberemo več točk), vidimo slike teh hiš v pregledovalniku.

Delo po skupinah

Učence razdelimo v skupine po pet, v zadnjih skupinah pa so po štirje učenci. Tako je namreč najpreprosteje organizirati kasnejše vnašanje podatkov.

Vsaka skupina dobi komplet kartic s slikami hiš in listke z imeni skupin.

  1. Učenci razdelijo kartice na štiri kupčke: panonske, alpske, kraške in “običajne”.

  2. Vsak učenec (v skupinah, kjer jih je pet, bo eden prost) prevzame en kupček. Njegova prva naloga je, da uredi kartice po številkah, od nižjih proti višjim.

  3. Učenci dobijo tablice, na katerih smo že odprli obrazce za vnos njihove razdelitve hiš.

    Učenci bodo morali najprej vpisati ime skupine. Izmislijo si ga sami. To je potrebno zato, da lahko kasneje vidimo, katera skupina je pripravila katero razdelitev.

    Sledijo slike hiš: pri vsaki hiši shranijo, na kateri kupček so jo dali. Vnašanje najboljše poteka tako, da tablico prevzame peti učenec. Ta bere zaporedne številke hiš in oglasi se učenec, na čigar kupčku je hiša s to številko. (Zato je praktično, da jih je v skupini pet in zato je nujno, da so kupčki urejeni po številkah.) Skupine s štirimi učenci se lahko (po zgledu skupine na eni od šol, kjer smo aktivnost preskušali) organizirajo tako, da je tablica na sredi in odgovor vedno pritisnetisti učenec, na čigar kupčku je posamična hiša.

    Ko vnesejo vse odgovore, počakajo, da končajo tudi ostale skupine.

Analiza rezultatov

Na svoj računalnik prenesemo podatke in slike. Če je bil obrazec na naslovu https://data.pumice.si/paprika-vrtnica, so podatki na https://data.pumice.si/paprika-vrtnica/data. Odpremo arhiv, da dobimo mapo s podatki (hise.tab) in slikami.

Če smo učencem že prej kazali slike (s primerom podatkov), zdaj v gradniku Datoteka le zamenjamo ime datoteke s hise.tab iz mape, ki smo jo pravkar prenesli. Če nismo, pa zdaj storimo, kot je opisano zgoraj: na platno postavimo gradnik Datoteka, ga povežemo z Zemljevidom, da pokažemo lokacije hiš in s Pregledovalnikom slik, da pokažemo slike hiš na posamičnih točkah.

Prenešena tabela je videti tako:

Stolpec “vrsta hiše” vsebuje dejansko vrsto hiše, naslednja dva vsebujeta zemljepisne koordinate, naslednji ime datoteke (da jo Pregledovalnik slik lahko pokaže), potem kraj, zadnji štirje stolpci pa povedo, kako so hiše razvrščali učenci. Njihova imena so imena skupin; v datoteki iz primera so to sloni, veverice, šakali in antilope.

V Zemljevidu lahko spremenimo barvo v ime skupine, pa bodo barve predstavljale tipe hiš, kakor jih je določala ta skupina. Pri tem se splača povečati velikost točk in njihovo neprosojnost ter dodati nekaj tresenja. Slednje razmakne točke, ki se prekrivajo; kar nekaj hiš, na primer, je iz Štanjela.

Vidimo, da imajo Šakali nekaj težav s kraškimi hišami, pa v Prlekiji in na Štajerskem so zagrešili dve alpski, zraven Novega mesta eno Kraško…

Ker smo na Zemljevid priključili Pregledovalnik slik, lahko klikamo po zemljevidu in si v pregledovalniku ogledamo posamične napačno uvrščene hiše in se pogovarjamo o njih. Podobno storimo za vse skupine in vidimo, ali so se motili pri istih hišah.

Po izkušnjah iz razreda so lahko učenci presenetljivo uspešni in narobe razvrstijo le nekaj slik.

Napake lahko opazujemo tudi z gradnikom Pivotna tabela. Tega priključimo na Datoteka. “Stolpci” lahko nastavljamo na različne skupine, na primer, v našem primeru Šakali.

Zdaj vrstice predstavljajo dejanske tipe hiše, stoplci pa tipe, ki jih predvidijo učenci. Vidimo, da je med hišami, ki so jih šakali prepoznali kot alpske, deset alpskih, ena kraška in dve panonski. Poleg tega so eno kraško deli med običajne in eno običajno med kraške.

Če bi radi pogledali, slike hiš, pri katerih so se zmotili, povežemo Pivotno tabelo s Pregledovalnikom slik. Pivotna tabela ima več izhodov. Na privzetem pošilja tabelo s številkami, ki jih vidimo v gradniku, mi pa bi radi podatke, ki pripadajo posamičnim celicam. Zato moramo po dodajanju gradnika prevezati njegove izhode.

Zdaj lahko klikenmo posamezno celico v Pivotni tabeli in vidimo pripadajoče slike hiš. Tule, recimo, sta “alpski” hiši iz Prlekije.

Bi to zmogel tudi računalnik?

Računalniki, vemo, znajo prepoznati vsebino slik, saj znajo po internetu iskati slike mačk in psov. Pa znajo ločiti tudi med panonskimi in kraškimi hišami?

Tu lahko učitelj - odvisno od tega, kako dobro pozna področje in kako suveren je - načne debato o dveh možnih nalogah. Prva je, da računalniku preprosto damo slike brez oznak regij in mu naložimo sestaviti štiri skupine hiš. Druga je, da mu pokažemo primere hiš v posamezni regiji, njegova naloga pa je, da se nauči prepoznavati, kako je videti tipična hiša iz posamezne regije in to znanje dokaže na novih primerih hiš. Učencem, s katerimi smo se o tem pogovarjali, se je zdelo, da je prva naloga lažja.

Učencem lahko pokažemo tabelo, ki jo prebere prvi gradnik Datoteka: ta vsebuje imena datotek, imena krajev in lokacij, ne pa podatkov o sami sliki. Če želimo, da računalnik rešuje katerokoli od gornjih nalog, mora slike najprej pretvoriti v obliko, ki mu bo povedala nekaj o vsebini. Gradnik Datoteka povežemo z Vložite slik, tega pa s Tabela. Ko Vložitev slik konča svoje delo (slike mora poslati na strežnik, ki jih obdela in vrne rezultate), se v tabeli pojavi 2048 dodatnih stolpcev. Učencem lahko povemo, da so to številke, ki na nek način opišejo sliko. Kaj pomenijo - ne ve nihče. Vemo le, da je v njih dovolj podatkov, da lahko računalnik na podlagi njihovih vrednosti razlikuje med slikami. Številke so dobljene z nevronsko mrežo; postopek, po katerem delajo je znan, saj smo ga naredili ljudje, številk, ki jih ta postopek pridela, pa ne znamo razlagati, saj je vsaka zase brez pomena, vseh skupaj pa je preveč, da bi jih lahko razumeli in razlagali.

Gručenje

Najprej se lotimo prve naloge: zanima nas, ali zna računalnik sam prepoznati različne vrste hiš, ne da bi mu povedali zanje. Iz podatkov zato najprej odstranimo stolpce v tipi hiš. Za to uporabimo gradnik Izbor stolpcev, ki ga priključimo na Vložitev slik. Stolpce, ki predstavljajo odgovore učencev, povlečemo v leti del, stolpec “vrsta hiše” pa med “meta spremenljivke”. To pomeni, da bodo ostali v podatkih, vendar jih postopek gručenja ne bo uporabljal.

Na Izbor stolpcev priključimo zaporedje gradnikov Razdalje - Hierarhično gručenje - Pregledovalnik slik. V Razdalje izberemo kosinusno razdaljo (delovale bi tudi druge, vendar je ta najprimernejša; razlaga je pretežka za učence in ne zelo pomembna za učitelje).

Odpremo Hierahično Gručenje in ga nakoliko nastavimo.

  • Oznake postavimo na “kraj”, da bomo videli imena krajev s hišami.
  • Barva nastavimo na “vrsta hiše”, da se pokažejo kvadratki, ki predstavljajo barve hiš.
  • V Izbor izberemo Prvih N in določimo, da želimo videti 4. skupine.

Delovanja gručenja nima smisla podrobno razlagati (niti za to ni časa). Razložimo le, da je računalnik združeval slike po podobnosti, tako da je začel s posameznimi slikami, ki jih je postopno združeval v vedno večje skupine. Postopek smo ustavili pri štirih skupinah, ki so označene s C1, C2, C3 in C4 ter različnimi barvami. Na desni strani vidimo imena krajev in, levo od njih, barve, ki predstavljajo različne regije. S tem, da se barve ne ujemajo, ni nič narobe - C1 ima pač modro barvo, panonske hiše pa so obarvane oranžno. Slabo pa je, da imamo znotraj različnih skupin hiše različnih tipov.

Računalnik je lepo združil panonske hiše v eno skupino (C4), le tri kraške so se prikradle mednje. Lepo so mu uspele tudi alpske (C3), ki se jim je pridružila ena panonska in ena kraška. Manj uspešen je bil, kar se tiče ostalih: C2 res vsebuje skoraj same običajne hiše, vendar najdemo običajne tudi v C1, kjer so pomešane s kraškimi.

Torej? Je računalnik uspešno razvrstil slovenske hiše na tipične vrste? Kakšno oceno bi mu dali? Mogoče trojko, ali dvojko, če smo strožji?

Kar je naredil računalnik, sploh ni slabo, saj ni vedel, kaj pravzaprav hočemo od njega. Dobil je kup slik in skupine bi lahko sestavljal tudi glede na to, ali so na sliki tudi kakšna drevesa ali pa, ali se hišam na slikah vidijo vrata ali ne. To, da je tako uspešno prepoznal, da se panonske in alpske hiše ločijo od ostalih, je pravzaprav odlično.

Klasifikacija

Zdaj pa druga naloga: računalniku pokažemo nekaj slik, za katere povemo, kakšen tip gradnje kažejo. Potem mu kažemo slike hiš, ki jih prej ni videl in preverimo, ali pravilno prepozna njihov tip.

Na Vložitev slik spet priključimo Izbor stolpcev, ki ga zdaj nastavimo malo drugače stolpce, ki so jih prispevali učenci, spet odstranimo, vrsta hiše pa mora biti Cilj - to, kar bi radi napovedovali.

Izbor stolpcev priključimo na Testiraj in meri. Na platno dodamo Logistično regresijo in jo priključimo na Testiraj in meri. V Testiraj in meri izberemo Izpusti enega. (Spodnja slika kaže doslej dodane gradnike, poleg njiju pa še Matriko zmot in nov Pregledovalnik slik, ki ju bomo dodali kasneje.)

Tačas ko računalnik dela, kar nakazuje njegovo ime, namreč računa, lahko s kupčkom slik v roki lahko učencem razložimo, kaj počne. Lahko, recimo, vzamemo eno sliko, jo potisnemo v zadnji hlačni žep in razložimo, da računalniku kažemo ostale slike – alpska, alpska, kraška, alpska, panonska, običajna … Računalnik si mora nekako zapomniti, kaj je tipično za katero. Potem izvlečemo sliko iz žepa in rečemo, da bo moral računalnik za to sliko povedati tip gradnje. Morda bo zadel, morda zgrešil. Nato pospravimo v žep naslednjo sliko in ponovimo. Povemo, da bomo na ta način eno za drugo skrili vse slike. Na koncu nas bo zanimalo, za koliko od teh slik se bo računalnik zmotil.

Računalnik se torej uči prepoznavati slike. Ker je računalnik stroj, temu rečemo strojno učenje, v angleščini machine learning. Strojno učenje je eno najpomembnejših področij umetne inteligence. Raziskovalci so se začeli z njim ukvarjati že v šestdesetih in razvili veliko različnih postopkov. Eden od njih - ki pravzaprav izvira iz statistike - se imenuje logistična regresija. Tule jo uporabljamo, ker se navadno dobro ujame z nevronskimi mrežami (ki so v resnici mreže, ki vsebujejo tisoče in tisoče logističnih regresij).

Gradnik Testiraj in meri v stolpcu točnost pokaže delež pravilno prepoznanih slik. Tule bi moral biti 0.936, torej je računalnik pravilno uvrstil 93,6% slik. (Če malo odstopa, nič narobe - v tem primeru bo rezultat drugačen tudi v Matriki zmot; če je rezultat bistveno slabši, preverite nastavite v Testiraj in meri, predvsem pa v Logistična regresija: pravilne, privzete vrednosti so regularizacija Ridge (L2) in C=1, brez uravnoteževanja razredov.)

Nato pokažemo in razložimo Matriko zmot.

Matrika zmot je podobna Pivotnin tabeli: vrstice matrike ustrezajo dejanskim tipom, stolpci napovedim. Za dve kraški hiši se je računalnik zmotil in ju uvrstil med alpske in običajne, eno običajno pa med kraške.

Na Matriko zmot priključimo Pregledovalnik slik in Zemljevid. Zdaj lahko klikamo na celice z napačno uvrščenimi hišami in v Pregledovalniku vidimo, kakšne so, na zemljevidu pa, kje so.

Učencem se bo seveda zdelo imenitno, če bo računalnik naredil več napak kot oni.

Pogovor o umetni inteligenci

Če se učitelj počuti dovolj suvereno, lahko tu nadaljuje pogovor o umetni inteligenci.

Nalogama, ki smo ju dali računalniku, rečemo gručenje (clustering) in klasifikacija (classification). Katera je dejansko težja.

V tem primeru očitno gručenje, vendar le zato, ker si vnaprej predstavljamo, kakšne gruče bi moral najti računalnik, ta pa ne more brati naših misli. Ker skupine tvori glede na vsebino slik, morda v eno postavi vse slike, ki poleg hiše vsebujejo kako drevo. Ali pa oblak. Ali pa takšne, na kateri se vidijo vrata hiše. In je levo od vrat sodo števil oken. Tega ne moremo vedeti, lahko le ugibamo - ali sklepamo iz slik v posamezni skupini. Problem je v tem, da računalnik slike pretvori v tistih 2048 številk, ki nam ne pomenijo ničesar - pa še preveč jih je. Zato ne moremo imeti vpogleda v to, kaj skupine v resnici predstavljajo.

Druga naloga je tule preprostejša, ker računalnik vodimo (v angleščini temu rečemo supervised learning).

Ko smo učno uro preskušali sami, je vodila še veliko globlje - na koncu smo se pogovarjali celo o tem, ali računalnik v resnici kaj ve, kar pravzaprav pomeni vedeti in ali lahko računalnik sploh kdaj kaj ve na enak način, kot vemo ljudje.

  • Predmet: družba, spoznavanje okolja, zemljepis
  • Starost: peti razred
  • UI tema: klasifikacija, gručenje
  • Avtor ideje: Ana Farič
  • Materiali za izvedbo
  • Priprava na uro
    • natisnite in razrežite kartice s slikami hiš - toliko kompletov, kolikor bo skupin s petimi oz. štirimi učenci
    • na šoli rezervirajte tablice ali računalnike
    • shranite primer arhiva, kot ga dobite na strani za zbiranje podatkov, in doma preizkusite obdelavo podatkov
    • na učiteljev računalnik mora biti nameščen Orange z dodatkoma Geo in, po možnosti, Image Analytics
    • dobro je tudi, da preverite, ali Orange pokaže slike (glej tehnične pripombe na koncu opisa ure)
    • na strani za vnos podatkov (gornja povezava) pripravite obrazec za vnašanje. Dobili boste povezavo za vnos podatkov (vnesete jo v tablice) in prenos rezultatov."
Umestitev v predmetnik
Učna ura najbolj sodi v predmet Družba v četrtem razredu OŠ