Database Noctua: de berekeningen

Database Noctua: de berekeningen

W.N. (Willem) Ellis - Werkgroep Vlinderfaunistiek

De database Noctua
Voor het berekenen van vluchtcurven, talrijkheid en daarmee samenhangende getallen wordt gebruik gemaakt van de gegevens in de waarnemingendatabase 'Noctua'. Dat is een gegevensbestand van Nederlandse vlinders dat wordt beheerd door De Vlinderstichting en de Werkgroep Vlinderfaunistiek. Ook wordt dankbaar gebruik gemaakt van nachtvlindergegevens die door Telmee en Waarneming.nl aan ons ter beschikking worden gesteld. In Noctua worden twijfelachtige en nog niet gevalideerde waarnemingen als zodanig gevlagd, en buiten de berekeningen en kaartjes gehouden. Ook wordt er veel zorg aan besteed om te voorkomen dat herhaling van eenzelfde waarneming in de database geen storende effecten heeft.

Noctua bevat op dit moment (maart 2019) ruim 6 miljoen waarnemingen. De laatste jaren komen er per jaar honderdduizenden waarnemingen bij, waardoor het mogelijk is goed de voor- of achteruitgang van soorten te volgen. De desbetreffende berekeningen worden hieronder toegelicht. De meeste berekeningen worden uitgevoerd voor de afgelopen 30 jaar.

Aantal exemplaren
Het aantal exemplaren van een soort per waarneming is van grote betekenis voor het schatten van de talrijkheid. Wanneer een waarneming een niet-exacte aantalaanduiding geeft (bijvoorbeeld 'veel' of 'enkele') wordt deze met behulp van een tabel vertaald naar een zoveel mogelijk aansluitende numerieke waarde. Wanneer bij een waarneming helemaal geen aantalindicatie is gegeven, wordt één exemplaar verondersteld.
Een bekend probleem met aantallen is dat een enkele heel hoge waarde het totaalbeeld buiten proportie beïnvloedt. De gebruikelijke oplossing hiervoor is om het aantal, zeg x, om te zetten in x’ = log(x+1).
Rupsen vormen een probleem apart. Als je een beeld wilt hebben van de grootte van een populatie kun je de aantallen rupsen en vlinders niet bij elkaar optellen, omdat het grootste deel van de rupsen het nooit tot vlinder zal brengen. Daarom wordt, als het niet om imago's gaat, x’ berekend als x’ = log[(x/100)+1].

Categorie
Een soort is òf macronachtvlinder, òf micronachtvlinder òf dagvlinder. Deze drie categorieën worden niet op dezelfde wijze bemonsterd, en veel waarnemers beperken zich ook tot maar één of twee van deze groepen. Daarom worden berekeningen in het algemeen voor elk van deze categorieën apart uitgevoerd.

Aantal waarnemerdagen
Een waarnemerdag is het feit dat een waarnemer op een datum op een plaats tenminste één vlindersoort heeft waargenomen. Het aantal waarnemersdagen, per periode en/of per gebied, wordt voor elke categorie apart bepaald.

Talrijkheid ofwel abundantie, log-abundantie en zeldzaamheid
De talrijkheid van een soort wordt in principe berekend als het aantal exemplaren per waarneming, dus als het totaal van de (getransformeerde) aantallen exemplaren (x’) gedeeld door het aantal waarnemingsdagen (CE, 'collection events'). Omdat bijna altijd CE vele malen groter is dan x’, levert dit een getal met een aantal voornullen, wat lastig lezen is; daarom is het handig het getal met 10000 te vermenigvuldigen.
Een waarnemingsdag in het najaar heeft geen betekenis wanneer we de talrijkheid willen berekenen van een soort die alleen in het voorjaar vliegt. Daarom worden bij berekeningen voor elke soort alleen die waarnemersdagen gebruikt die vallen binnen zijn vliegtijd.
Bij berekeningen over een klein gebied en/of een korte periode is er het probleem dat de noemer, CE, vaak vrij klein is, geringe verschillen in de teller onzinnig grote verschillen teweegbrengen in het eindresultaat. Een toevallig nogal hoge waarde van ∑x’, bij misschien maar twee of drie waarnemingen, wordt zo extreem uitvergroot. Daarom ziet de formule die uiteindelijk wordt gebruikt er aldus uit: talrijkheid= 10000*∑x’/(CE+100/CE). Het toevoegen van 100/CE aan de noemer heeft geen effect van betekenis wanneer CE groot is, maar dempt de uitschieters wanneer CE klein is.
Het resultaat van deze berekening per soort loopt uiteen van een eind onder nul tot ver boven de duizend. Wanneer soorten met elkaar worden vergeleken leidt dit ertoe dat de talrijke soorten het beeld sterk gaan domineren. Daarom is het vaak verstandig om de log-abundantie te gebruiken.
Zeldzaamheid is het omgekeerde van talrijkheid, en dus eenvoudig te bereken als 1/talrijkheid of, meestal zinvoller, 1/log-abundantie.

Gewogen talrijkheid
Hoe groter het aantal jaren is dat een soort in een gebied is waargenomen, des te groter is de waarschijnlijkheid dat de soort daar een vitale populatie heeft. Maar daarbij zijn we uiteraard het meest geïnteresseerd in de meest recente jaren. Dat kunnen we inbouwen in de berekening van de talrijkheid, door de x’ in de berekening hierboven een gewicht te geven, dat hoger is naarmate de waarneming recenter is. Wanneer we bijvoorbeeld de talrijkheid berekenen over de periode 1980-2012 is dat in een bepaald waarnemingsjaar: w = (waarnemingsjaar-1980+1)/(2012-1980+1). De gewogen talrijkheid is dan 10000*∑w*x’/(CE+100/CE).

Van aaa tot zzz
Een samenvattend beeld van de algemeenheid van een soort moet gebaseerd zijn op de landelijke gewogen talrijkheid (t) en het aantal uurhokken waar de soort voorkomt (u). Dat getal u kan preciezer, omdat voor elk uurhok de gewogen talrijkheid van de soort bekend is (w); dan is u’ = ∑w over alle uurhokken. De twee kunnen worden gecombineerd als z = t*u’. Om z in woorden te vangen worden alle soorten van een categorie afdalend gesorteerd op hun z-waarde. Als er n soorten zijn, dan scoren de eerste n/6 soorten ‘aaa’, de volgende n/6 krijgen ‘aa’, enz.

aaa = zeer algemeen, aa = algemeen, a = vrij algemeen, z = vrij zeldzaam, zz = zeldzaam, zzz = zeer zeldzaam.

Prestatie, preferentie
Een reeks jaarlijkse talrijkheidcijfers van een soort kan worden gestandaardiseerd door van elk getal het gemiddelde af te trekken, en het resultaat te delen door de standaarddeviatie: p = (x-gem)/sd. Deze werking heet standaardiseren omdat de ups en downs van alle soorten nu vergelijkbaar zijn, ondanks eventuele verschillen in gemiddelde talrijkheid.
Op soortgelijke manier kan worden gekeken naar de talrijkheid van een soort in een aantal gebieden. Door die aantallen vervolgens op dezelfde wijze te standaardiseren ontstaat een beeld van de 'voorkeur' voor een soort voor bepaalde gebieden: de 'preferentie'.

Presentie
Het berekenen van de talrijkheid op de hierboven beschreven wijze is niet mogelijk wanneer de meeste gegevens stammen uit publicaties of collecties, omdat het aantal collection events niet te reconstrueren is, en omdat gewone soorten gewoonlijk sterk ondervertegenwoordigd zijn. Dit geldt voor vrijwel alle gegevens van voor 1980. De presentie is dan een alternatieve maat, zij het zeker geen perfecte.
De berekening begint met een tabel: soorten verticaal, jaren (gebieden etc.) horizontaal. Het totaal aantal waarnemingen per soort (rij) noemen we r, het totaal aantal waarnemingen per kolom noemen we k. Het totaal aantal waarnemingen in de hele tabel noemen we N.
Het aandeel dat een soort dan heeft in de totale fauna is = r/N. Je mag dan verwachten dat die soort in een gegeven kolom met r*k/N waarnemingen vertegenwoordigd zal zijn: dit te verwachten aantal noemen we exp. We kunnen dat dan vergelijken met het werkelijk waargenomen aantal, obs. Dit gebeurt met de berekening (obs-exp)/(obs+exp), die een getal oplevert dat ligt tussen + 1 en - 1.

Trend, verandering per periode
Een indruk van de voor- of achteruitgang van een soort is te krijgen door over een langere periode de jaarlijkse talrijkheid te bepalen, en daarover de trend te bereken (het 'lineaire regressie-coëfficiënt'). Vaker wordt echter, op basis van de regressievergelijking, het aantal berekend aan het begin en einde van de periode, en het verschil uitgedrukt als een percentage van de beginsituatie.

Perspectief
Hoe het op langere termijn met een soort zal aflopen, bij ongewijzigde omstandigheden, hangt af van zijn landelijke gewogen talrijkheid, en van de trend. De achteruitgang van een gewone soort is minder dramatisch dan dezelfde mate van achteruitgang bij een zeldzame soort. Een probleem daarbij is dat er van zeer zeldzame soorten vaak zo weinig waarnemingen beschikbaar zijn dat er geen significante trend kan worden berekend. Voor die soorten is feitelijk alleen de talrijkheid bepalend voor hun perspectief.
Om talrijkheid en trend in één getal te combineren worden enkele bewerkingen gedaan. De landelijke, gewogen, talrijkheid loopt zeer sterk uiteen (bijv. bij de macronachtvlinders van 0.00004 tot 208). Daarom is eerst een transformatie nodig a = log(1+talrijkheid). Vervolgens wordt a gestandaardiseerd als a’ = a - de mediane waarde. De spreiding van de trend (t) is ongeveer vijfmaal zo groot als die van a’. Daarom wordt het perspectief: t+5*a’.
Voor macronachtvlinders ligt het perspectief tussen -5 en + 18. Door negatieve waarden te vermenigvuldigen met 10/5, en positieve waarden met 10/18, kan een makkelijker te interpreteren perspectiefgetal worden berekend dat ligt tussen -10 en +10.

Biodiversiteit van een gebied
Als bijdrage van een afzonderlijke soort aan de biodiversiteit van een gebied wordt de waarde b = 1 + log (u/n) beschouwd. Hierbij is u = de talrijkheid van de soort in het gebied, en n = de talrijkheid van de soort in het gehele land (beide in de periode 1980-heden). De totale biodiversiteit is dan de optelsom van b over alle soorten die in het gebied sinds 1980 zijn waargenomen.