Hoe maak je een databank voor taalvariatie?

Als u het een beetje gevolgd hebt, weet u dat ik tussen 2015 en nu veertien vragenlijsten online heb gezet. En als u het niet gevolgd hebt, dan weet u dat nu. De invullers van het eerste uur hebben waarschijnlijk ook gemerkt dat er een evolutie(tje) is geweest in de manier waarop ik naar de persoonlijke gegevens, en dan met name de plaatsnamen vroeg. Tot het 7de mini-onderzoekje moest u de plaatsnamen en postcodes zelf invullen, vanaf het 8ste wordt u via uw land en provincie geleid naar een vaste lijst. Daar is – natuurlijk – een reden voor.

Kloeke

Al vanaf het eerste mini-onderzoekje wilde ik de resultaten op een taalkaart zetten. Ik ben dan ook meteen op zoek gegaan naar manieren om die kaarten zelf te maken. En ik had wel wat criteria. Omdat dit een vrijetijdsproject is waar ik zelf niets aan verdien, moest de software betaalbaar (liefst gratis) zijn, de voorbereidingen mochten me geen uren werk kosten en de resultaten moesten zowel duidelijk als mooi zijn. Ik ben behoorlijk veeleisend.

kloeke taalkaart

Een kaart maken met Kloekecodes

Mijn eerste kaarten maakte ik met een gratis carteertool van het Meertens Instituut. Het voordeel daaraan is duidelijk: de tool is gratis en je kunt er inderdaad zonder enige programmeerkennis makkelijk taalkaarten mee maken. Maar er zijn ook een aantal nadelen: je moet werken met de Kloekecodes (in mijn geval: ze eerst met de hand aan de plaatsnamen koppelen), je hebt maar een beperkt aantal symbolen ter beschikking, je kunt je kaarten niet tijdelijk opslaan en de enige manier om het resultaat te bewaren is via Print Screen. Leuk om af en toe eens een eenvoudig kaartje te maken, maar dat is niet goed genoeg voor mij.

QGIS

Ik ben daarna op zoek gegaan naar andere opties. Om een lang verhaal kort te maken: na een hele zoektocht ontdekte ik QGIS, een opensourcesoftware die ook in de opleiding Geografie/Geomatica aan de UGent wordt gebruikt. Prima software, alleen moest ik nog enkele drempels overwinnen om die zo vlot te kunnen gebruiken als ik wilde: ik had plaatscoördinaten nodig, grondkaarten en een invoersjabloon waarmee ik de gegevens uit mijn vragenlijsten snel kon klaarmaken voor een bruikbaar bestand voor QGIS.

QGIS

QGIS en de grondkaart

Mijn zus, die geografe is en gespecialiseerd in het maken van kaarten, kon me aan de noodzakelijke plaatscoördinaten en grondkaarten helpen (dank je wel, zus). Maar daarmee waren we er nog niet. De plaatsnamen in de vragenlijsten moesten exact overeenkomen met die in de lijst met coördinaten. Dat betekende dat ik alle tik- en andere fouten uit de lijsten met plaatsnamen die ik op dat moment al gebruikte moest halen. Voor enkele duizenden plaatsnamen betekende dat toch heel wat uren werk. Vervolgens botste ik op de beperkingen van Excel. Het is een prima programma om gegevens in te verzamelen en berekeningen in uit te voeren, maar zodra je gaat sorteren, kan het misgaan. Na een paar kaarten die er toch vreemd uit zagen, en waar de gegevens na enkele sorteeropdrachten door elkaar bleken te zitten, ben ik gezwicht. Voor Access.

Access

Ik geef toe: ik had een probleem met Access. Dat heeft alles te maken met mijn tijd als redacteur van het Woordenboek van de Brabantse Dialecten, toen ik wel in een handomdraai kaarten kon maken. Om onze gegevens te verwerken, gebruikten we toen niet Access, maar Filemaker als databanksoftware. En daar kon ik een heel stuk beter mee overweg dan met Access. Ik heb het programma toen nooit echt onder de knie gekregen, onder meer omdat ik een beter alternatief had.
Maar Filemaker is duur, en Access staat wel gewoon op mijn pc en voldoet dus aan het criterium ‘betaalbaar, het liefste gratis’. Daarom heb ik me er toch aan gewaagd. En eigenlijk viel het best mee, misschien omdat mijn kennis van Filemaker intussen onder een dikke laag stof ligt. Opnieuw lang verhaal kort: ik heb een databank gebouwd waarin ik alle gegevens vlot en gemakkelijk uit de mini-onderzoekjes kan invoeren, koppelen, sorteren, verwerken en klaarmaken voor een taalkaart. Er is nog wel voorbereidend werk nodig aan een kaart, zoals het toekennen van trefwoorden, maar wat wel automatisch kan, gebeurt nu ook automatisch. Hier lees je er meer over.

Taaldatabank in Access

De taaldatabank in Access

In de toekomst?

Kan ik nu alle kaarten maken die ik wil? Nee, nog niet. Het belangrijkste kan wel, namelijk die mooie, duidelijke kaarten op een vlotte manier maken op basis van de antwoorden op mijn mini-onderzoekjes. Maar ik wil meer. Zo wil ik nog plaatscoördinaten toevoegen voor een ruimer gebied (Frans-Vlaanderen, het westen van Duitsland, …) en ik wil de Kloekecodes aan de plaatsnamen koppelen, zodat ik ook gegevens uit oude vragenlijsten uit Amsterdam, Leuven of Gent makkelijk tot een taalkaart kan verwerken. En daarnaast wil ik met QGIS verder experimenteren, zodat ik er ook vlakkenkaarten, lijnkaarten en misschien zelfs heatmaps mee kan maken. Maar dat is nog allemaal toekomstmuziek.

Reacties zijn gesloten.