V tej učni uri spoznamo preprost primer priporočilnega sistema. Ura je privlačna zaradi teme - izbirati morajo svoje najljubše risanke -, seveda pa učence zanima tudi, na kakšen način jim spletne strani z videi priporočajo videe. Uro lahko zapeljemo tudi tako, da govorimo o tem, kako nas tovrstni sistemi, ki ne služijo le priporočanju video posnetkov, temveč tudi novic in objav na družbenih medijih, ujamejo v mehurčke in nam prikažejo le tisto, kar že poznamo in nam je všeč.
Ura ima matematično ozadje. Če jo izvajamo s starejšimi učenci, lahko vključimo množice (preseki, unije); z mlajšimi računamo velikosti presekov, vendar brez terminologije. Učenci narišejo tudi graf podobnosti, nekakšen sociogram, pri čemer prav tako ne uporabljamo teh izrazov.
Uro lahko izvedemo tako, da učenci najprej izbirajo kartice z risankami in sami, na papir, sestavijo priporočilni sistem v okviru skupine. Nato uporabimo računalnik in nadaljujemo s sistemom, ki temelji na podatkih za ves razred. V takšni izvedbi aktivnost vzame dve šolski uri. Če jo želimo skrajšati, prvi del preskočimo in učenci že takoj vnašajo podatke v računalnike, vendar je ura v tej obliki manj zabavna in tudi manj poučna, saj sistema ne sestavijo sami, temveč ga zgolj opazujejo.
Za uvod se z učenci pogovorimo o tem, ali gledajo spletne strani z videi in kako jim te strani, po njihovem mnenju, priporočajo videe. Najbrž bodo povedali, da jim stran “pač priporoča posnetke, podobne tem, ki jih običajno gledajo”, po čemer jih vprašamo, na kakšen način stran ugotovi, ali so posnetki podobni. Če odgovorijo, da po opisih, lahko povemo, da so opisi pogosto kratki. Predvsem pa - kako primerja opise? Sta si dva opisa podobna, če vsebujeta podobne besede?
Obljubimo jim, da bomo pokazali, kako bi deloval sistem, ki se ne bi zanašal na opazovanje vsebine videov.
Pred uro na strani za vnos pripravimo obrazec za vnos. Izberemo število risank, ki jih bodo morali izbrati učenci (privzeta nastavitev, 7, bi morala biti primerna za četrti razred) in dobimo povezavo, na primer https://data.pumice.si/princesa-zmaj
. To povezavo vnesemo v tablice (ali računalnike), ki jih bodo učenci uporabljali za vnašanje podatkov.
Stran lahko tudi sami preskusite, tako da oddate nekaj izmišljenih izbir, ali pa poskusite primer izmišljenih podatkov. Za delo v razredu nato sestavite nov obrazec z novo povezavo.
Učence razdelimo v skupine s približno 8 učenci.
Vsaka skupina dobi list velikosti A3 in kartice s slikami risank; za vsako lahko natisnemo dva kompleta, tako da se vsaka risanka pojavi dvakrat. Vsak učenec dobi list papirja (zadoščal bo A5).
Vsak učenec izbere 7 risank, ki so mu najbolj všeč. Na levo stran lista napiše njihove številke in imena. (Isto risanko lahko izbere poljubno število ljudi. V razredu se je zgodilo, recimo, da so v neki skupini “punce pobrale vse ta najboljše risanke” in jih fantje zato niso mogli izbrati. :)
Če aktivnost izvajamo s starejšimi učenci, lahko dovolimo različno število, recimo 6-9 risank. V tem primeru bo potrebno računati preseke in unije ter vaditi deljenje in decimalna števila. Detajli so opisani spodaj.
Vsak učenec obkroži tiste tri člane skupine, ki so izbrali največ istih risank kot on. Če si tretje mesto deli več učencev, izbere poljubne med njimi; na koncu naj bodo obkroženi le trije učenci.
Skupina vzame list A3. Nanj napiše imena vseh članov skupine. Vsak član nariše puščice do tistih treh sočlanov, ki so mu najbolj podobni. Skupine lahko spodbudimo, da narišejo čim lepšo sliko - takšno, v kateri so tisti, ki so si bolj podobni, narisani bližje skupaj in tako, da se povezave čim manj križajo.
Vsak član skupine k svojemu imenu z modro barvo napiše številke risank, ki jih je izbral.
Vsak član skupine k imenom ostalih članov z rdečo barvo napiše številke risank, ki so jih izbrali tisti trije člani, ki so mu najbolj podobni. Če sta katere med njimi gledala dva od povezanih, jih obkroži; če vsi trije, jih obkroži dvakrat.
Te risanke so njegova priporočila: učenci lahko pogledajo, za katere risanke gre. Nekatere od njih že poznajo. So jim všeč? Priporočilni sistem deluje?
Ko so učenci dovolj daleč z delom (recimo med risanjem na papir A3), skupinam razdelimo tablice, v katerem smo vnesli povezavo do obrazca. Učenci poiščejo in izberejo svoje risanke.
Ko končajo, učitelj prenese podatke v svoj računalnik; povezava je enaka povezavi za vnos podatkov, le z data
na koncu, na primer http://data.pumice.si/princesa-zmaj/data
. (Že doma lahko poskusite primer takšnega arhiva.)
Nato sestavimo takšen delotok.
Brez panike, vse bomo razložili. Delotok lahko poberete tudi s te strani in v razredu le zamenjate URL, vendar je zanimivejše, če ga sestavljate sproti. (Nekatere učence v četrtem razredu je zanimalo, “kateri program je to, da lahko kar tako vlečete stvari skupaj”.)
V gradniku Datoteka zamenjamo URL z našim, na primer http://data.pumice.si/princesa-zmaj/data
(v resnici bo seveda drugačen). V gradniku Tabela lahko učencem pokažemo, kako so videti zbrani podatki: vrstice predstavljajo risanke, stolpci pa učence. Vrednosti so 1, če je učenec izbral to risanko, in 0, če je ni. Poleg tega vrstica vsebuje tudi ime risanke in ime datoteke z njenim posterjem. Nič takšnega.
Gradnik Razdalje izračuna razlike med učenci. Tu ne smemo pozabiti ustreznih nastavitev: računamo razdalje med stolpci in uporabimo Jaccardovo razdaljo.
V gradniku Matrika razdalj lahko, če želimo, pokažemo, kaj je rezultat tega izračuna. Razlika je 0, če sta izbrala enake risanke in 1, če sta izbrala same različne. Učenci so računali podobnosti in uporabili nekoliko drugačno formulo, v resnici pa gre za podobno reč. Če se nam na zdi potrebno, pa lahko ta gradnik in to razloga popolnoma brez škode preskočimo. (Za učitelje: Jaccardova podobnost je definirana kot velikost preseka risank deljena z velikostjo unije. Rezultat je število med 0 in 1, saj je presek največ tolikšen kot unija. Da dobimo Jaccardovo razdaljo, odštejemo Jaccardovo podobnost od 1.)
Sledi Omrežje sosedov. Ta gradnik nastavimo tako, da poveže vsakega učenca s tremi najbližjimi sosedi.
Rezultat pogledamo v Raziskovalcu omrežja.
Povezave so usmerjene: od vsakega učenca vodijo natančno tri puščice. K nekaterim vodi več puščic, takšni imajo najbrž bolj “osrednje” okuse.
In nato najpomembnejše: priporočila. Ta gradnik potrebuje podatke o podobnosti, torej mrežo, ki jo dobimo iz Omrežje sosedov, ter podatke o risankah, ki jih dobimo iz Datoteka. Zato ju je potrebno povezati z obema. In zdaj lahko vsak učenec vidi, katere risanke je izbral, kdo mu je podoben in, predvsem, katere risanke mu takšen sistem priporoča.
Če učencem dovolimo, da izbirajo različno število risank, podobnosti ne morejo računati kar kot število skupnih risank, saj bi si bili tisti, ki izberejo več risank, očitno podobnejši. Če se lotimo tako, je potrebno število skupnih risank deliti s številom vseh risank, ki jih je izbral eden ali drugi ali oba. Z bolj matematičnimi besedami: velikost preseka množic izbranih risank moramo deliti z velikostjo unije teh množic.
Za to je potrebno poznati decimalna števila, torej takšna aktivnost ne sodi ravno v četrti razred. Delno se je temu mogoče izogniti tako, da morajo število skupnih risank pomnožiti z deset ali celo 100 in nato izračunati celoštevilski količnik. Kakor presodite. :)
Učenci v aktivnosti uživajo: všeč jim je izbiranje risank, zanimivo jim je računanje podobnosti in risanje grafov. V komentarjih na koncu ure pa so povedali tudi, da jim je všeč, da zdaj vedo, kako (približno) delujejo takšne spletne strani.