Zemljevid na horuk

V prejšnji novici smo pisali o izzivu Priimkoslovje, v katerem sodeluje 56 šol iz vse Slovenije. Pa so res iz vse? No, recimo. Primorci nam manjkajo. Smo preverili, na gornjem zemljevidu.

Kako narisati takšen zemljevid? Najprej smo vzeli tabelo prijavljenih učiteljev. Nismo jih vprašali po kraju, temveč le po naslovu šole, tako da smo morali sami dodati stolpec s krajem in ga razbrati iz naslova. (Bomo vedeli za drugič.)

Naprej pa je šlo kot po maslu. Tabelo smo naložili v Orange. Poleg tega smo naložili tabelo s podatki o vseh slovenskih naseljih. (Čisto nova tabelica, ki jo ponuja gradnik Zbirke podatkov (Datasets): v njej je 6002 od 6035 slovenskih naselij. Nekaj se nam jih je izmuznilo, ker Wikipedija, s katere smo jih počrpali, zanje ni imela primerno urejenih podatkov.)

Delotok

Nato smo z gradnikom Združi stolpce (Merge Data) združili stolpce obeh tabel. Za vsako vrstico prve je pogledala vrednost v stolpcu “Kraj” in poiskala tisto vrstico druge, ki ima enak podatek v stolpcu “naselje”; stolpec z imenom kraja/naselja pač ni enak v obeh tabelah. Tako smo pridelali tabelo, ki ima poleg podatkov o prijavljeni šoli tudi koordinate kraja šole.

Zoprn detajl: v Sloveniji imamo 6035 naselij s 5271 različnimi imeni. Nekatera imena se ponovijo. Ker se Združi vrstice v tem primeru ne more odločati, smo z gradnikom Enkratni obdržali le po eno izmed večkrat ponovljenih imen - in držali pesti, da pravo, oziroma da se nobena izmed sodelujočih šol ne nahaja v katerem izmed teh krajev. Da bi to naredili pravilno, bi morali podatki o šolah vsebovati tudi občine - vendar jih ne.

Izločevanje podvojenih imen krajev in združevanje podatkov

Nato smo pripeli zemljevid in pridelali sliko na vrhu novice.