Ist die Vogelstimmen-Erkennung in OpenInsect wirklich kostenlos?

Ja. Die App ist im Apple App Store und bei Google Play kostenlos. Audio-Aufnahmen, Foto- und Video-Bestimmung sowie die KI-Auswertung samt Spektrogramm sind ohne Gebühr nutzbar. Es gibt keine Abo-Pflicht und keine versteckten Kosten für die Erkennung.

Wie genau ist die KI bei Vogelstimmen?

Bei klaren Aufnahmen typischer heimischer Singvögel ohne starken Störlärm erreicht das Modell sehr hohe Trefferquoten. Die App zeigt zusätzlich einen Konfidenz-Score und alternative Kandidaten an. Bei Wind, Verkehrslärm oder ähnlich klingenden Arten kann sich die KI irren – mehrere Aufnahmen helfen.

Funktioniert die App auch für Eulen, Frösche oder Insekten?

Ja. Eulenrufe, Froschchorgesang, Grillenzirpen und Zikaden werden von OpenInsect mit erfasst. Die Genauigkeit ist etwas niedriger als bei klassischen Singvögeln, weil die Datengrundlage kleiner ist.

Werden meine Aufnahmen weiterverwendet?

Aufnahmen werden für die KI-Auswertung verarbeitet und im Community-Feed angezeigt, wenn Sie den Beitrag öffentlich machen. Sie können Beiträge auch privat speichern. Details in der Datenschutzerklärung in der App.

Kann ich Vogelstimmen auch ohne Internet erkennen lassen?

Aktuell benötigt die KI-Auswertung eine Internetverbindung. Sie können Aufnahmen offline machen und später hochladen, sobald Sie wieder Empfang haben.

Herken vogelgeluiden gratis online en met een app

Herken vogelgeluiden gratis online en met een app - dit is nu binnen enkele seconden mogelijk. Met onze app OpenInsect neem je eenvoudig het lied of de roep van een vogel op met de microfoon van je smartphone, en een bio-akoestische AI bepaalt de soort - gratis, zonder registratie, met GPS-ondersteunde regionale logica en een wetenschappelijk ogend spectrogram voor elke treffer.

In deze gids laten we u zien hoe vogelzangherkenning werkt in OpenInsect, welke vogelsoorten betrouwbaar worden geïdentificeerd, hoe u de schoonst mogelijke opnames kunt maken en hoe de app zich verhoudt tot BirdNET, Merlin Bird ID of Naturblick.

Herken vogelgeluiden met je smartphone - sneller dan ze opzoeken

Vroeger had iedereen die een onbekende vogelroep wilde identificeren twee opties: een dik identificatieboek of de herinnering aan de laatste ornithologieles. Tegenwoordig is een smartphone voldoende. Vogelzang, vogelroep of vogelstem – AI-modellen voor bio-akoestiek herkennen op betrouwbare wijze typische frequentiepatronen, lettergreepstructuur en ritme van een oproep in slechts een paar seconden.

OpenInsect vertrouwt op een speciaal ontwikkelde AI-pijplijn met een analyselaag die is getraind op dierengeluiden. U hoeft dus geen vogelsoorten te identificeren, maar houdt de microfoon richting het bos, de tuin of het park en enkele seconden later ziet u de meest waarschijnlijke soort - inclusief een betrouwbaarheidsscore, regionale plausibiliteit en een professionele visualisatie van de opname.

Zo werkt de herkenning van vogelzang in de OpenInsect-app

De audiofunctie maakt deel uit van de gratis OpenInsect-app voor iOS en Android. Je installeert de app, opent de opnamepagina en volgt drie korte stappen:

Stap 1 – Open de microfoon

Op de opnamepagina vind je naast de foto en video een microfoonknop. Wanneer u tikt, wordt de audiorecorder geopend met een live golfvorm die uw invoervolume in realtime weergeeft. Zo zie je direct of de vogel luid genoeg is of dat wind- en straatgeluid het signaal overheerst.

Stap 2 – Neem maximaal 60 seconden op

Met de app kun je maximaal 60 seconden audio opnemen. Dit is genoeg voor meerdere coupletten of een volledige vocale loop. Stop de opname handmatig of laat de opname na 60 seconden automatisch stoppen. GPS-coördinaten worden - als u dit bij de eerste start hebt toegestaan - automatisch vastgelegd, zodat het model de voorkeur geeft aan regionaal plausibele soorten.

Stap 3 – AI-analyse en spectrogram

Bij het uploaden gaat het audiobestand naar onze server. Daar worden parallel een spectrogram met een frequentie-as van ongeveer 1–12 kHz en een gereinigde golfvorm gegenereerd. Beide verschijnen in je bericht samen met de AI-hit. Het resultaat ziet eruit alsof het afkomstig is van een wetenschappelijk hulpmiddel en kan worden gedeeld als een afbeelding met hoge resolutie.

Spectrogram en golfvorm worden voor elke opname op de server gegenereerd - met frequentie-as en tijd-as zoals een ornithologisch programma.

Wat de app kan doen

OpenInsect is niet zomaar een vogelzang-app, maar een gecombineerd identificatieplatform voor foto, video en audio. De volgende tabel laat zien wanneer welke modus de beste resultaten oplevert:

Modus Waarvoor geschikt Nauwkeurigheid Foto Zittende vogels, insecten, planten, paddenstoelen, schimmels, bomen zeer hoog met goede belichting Video Bewegingspatroon, vliegpatroon, gedrag hoog – meerdere frames worden geëvalueerd Audio Vogelgezang, uilengeluiden, spechten, kikkers, krekels, krekels het beste in vogels (klassiek bio-akoestisch domein)

Er zijn ook communityfuncties: een puntensysteem voor elke succesvolle upload, een streaksysteem voor regelmatige monitoring, een feed met alle publieke waarnemingen en de mogelijkheid om andere gebruikers te volgen of op berichten te reageren.

Welke vogelsoort herkent OpenInsect?

De KI is getraind op de meest voorkomende tamme zangvogels in Midden-Europa, maar kent ook vele andere soorten. De volgende selectie laat zien wat betrouwbaar wordt herkend:

Merel, Zanglijster, Grote Lijster, Kramsvogel
Koolmees, pimpelmees, koolmees, kuifmees, moerasmees
Vink, Brambling, Groenling, Putter, Sijs, Girlitz
Robin, zwarte roodstaart, roodstaart, nachtegaal
Wren, heggenmus, zwartkop, ratelslang, grasmus, grasmus
Tjiftjaf, Fitis, Boszanger, Boszanger, Rietzanger
Spreeuw, wielewaal, kardinaal, goudvink, geelgors, rietgors
Klever, boomkruiper, bosboomkruiper
Grote bonte specht, groene specht, kleine bonte specht, zwarte specht
Koekoek, Draaihals, Gierzwaluw, Boerenzwaluw, Huiszwaluw
Houtduif, Turkse duif, stamduif
Uilen: Bosuil, Steenuil, Kerkuil, Oehoe
Roofvogels: buizerd, torenvalk, havik, sperwer

Ook kikkers (boomkikkers, vijverkikkers, graskikkers), krekels (veldkrekels, huiskrekels), sprinkhanen en krekels worden in veel gevallen herkend. Het model behaalt echter het hoogste trefferpercentage bij vogels - de bio-akoestische classificatie wordt daar wetenschappelijk het best gedekt.

Tips voor goede foto's

Zelfs de beste AI is slechts zo goed als het ingangssignaal. Met deze tips verhoog je de hitrate merkbaar:

Verminder wind: Houd de microfoon achter een lichaamsdeel of jas om directe wind te blokkeren. Als de wind sterk is, is het beter om te wachten op een pauze.
Nabijheid helpt, en stilte ook: Hoe dichter bij de vogel, hoe beter, maar niet zo dichtbij dat hij omhoog vliegt. Een rustige achtergrond is belangrijker dan perfecte afstand.
Vermijd andere geluiden: Gesprekken, verkeer, blaffende honden of grasmaaiers verstoren het model. In parken is het beter om 's ochtends op te nemen vóór het gebruikelijke geluid.
Neem meerdere verzen op: Een enkele lettergreep is zelden genoeg. Twee tot drie zangversjes of roepsequenties geven het model voldoende stof.
Houd je smartphone op de juiste manier vast: Lijn de microfoon uit met de geluidsbron - bij moderne mobiele telefoons vaak aan de onderkant van de behuizing. Bedek het niet met uw hand.
Gebruik originele kwaliteit: schakel telefoongesprekken uit tijdens het opnemen of Bluetooth-headsets - de interne microfoon van de smartphone levert het beste signaal.

Vergelijking: OpenInsect versus BirdNET versus Merlin Bird ID

Er zijn verschillende bekende apps voor het herkennen van vogelzang. Hier is een eerlijke vergelijking:

Functie OpenInsect BirdNET (Cornell) Merlin Bird-ID Natuurzicht Audiodetectie Ja, tot 60 s Ja Ja, leef Ja Fotoherkenning Ja Nee Ja Ja (fabrieksfocus) Videodetectie Ja Nee Nee Nee Andere dieren (kikkers, insecten) Ja Nee Nee Gedeeltelijk Spectrogramvisualisatie Ja, in het bericht Ja Ja Nee Communityfeed en punten Ja Nee Nee Beperkt Taal Duits (eerste klas) Engels primair Meertalig Duits Kosten Gratis Gratis Gratis Gratis

In het kort: BirdNET en Merlin zijn uitstekende apps voor uitsluitend vogels, met jarenlang onderzoek achter de rug. OpenInsect komt goed tot zijn recht als je niet alleen vogels wilt identificeren, maar ook foto's, video en audio wilt combineren in één app - inclusief een communityfeed, punten en een Duitse interface vanaf het begin.

Online alternatief zonder app

U kunt ook foto's van vogels zonder app rechtstreeks naar onze website uploaden op Vogelidentificatie met foto online en ze binnen enkele seconden laten identificeren - zonder enige installatie.

Voor audio-opnamen van vogeloproepen heb je momenteel de OpenInsect-app nodig: microfoontoegang, GPS-opname en het maken van spectrogrammen op de server zijn nauw verbonden met de app. Een browser-only opname van de website is in voorbereiding.

Veelgestelde vragen

Is de herkenning van vogelzang in OpenInsect echt gratis?

Ja. De app is gratis in de Apple App Store en Google Play. Audio-opnamen, foto- en videobepaling en de AI-evaluatie inclusief spectrogram kunnen gratis worden gebruikt. Er is geen abonnementsvereiste en geen verborgen kosten voor detectie.

Hoe nauwkeurig is de AI met vogelgeluiden?

Met duidelijke opnames van typische tamme zangvogels zonder sterke storende geluiden, behaalt het model zeer hoge hitrates. De app toont ook een betrouwbaarheidsscore en alternatieve kandidaten, zodat u zelf het resultaat kunt beoordelen. De AI kan het mis hebben als het gaat om wind, verkeersgeluid of soortgelijke geluiden - meerdere opnames helpen.

Werkt de app ook voor uilen, kikkers of insecten?

Ja. Uilenoproepen, kikkergezang, krekelgezang en krekels worden opgenomen door OpenInsect. De nauwkeurigheid is daar wat lager dan bij klassieke zangvogels omdat de wetenschappelijke database voor deze groepen kleiner is. De resultaten zijn echter meestal solide voor de typische tuin- en bosoproepen van de plaatselijke fauna.

Zullen mijn opnamen hergebruikt worden?

Opnames worden verwerkt voor AI-evaluatie en weergegeven in de communityfeed wanneer u het bericht openbaar maakt. Je kunt berichten ook privé opslaan. Details over het gegevensgebruik vindt u in de gegevensbeschermingsverklaring in de app.

Kan ik vogelzang herkennen zonder internet?

De AI-evaluatie vereist momenteel een internetverbinding omdat de analyse op de server draait - dit maakt het zeer nauwkeurig en spaart de batterij van uw smartphone. Wel kun je opnames offline halen en later uploaden zodra je weer ontvangst hebt.

Dit is hoe AI-gebaseerde vogelzangherkenning wetenschappelijk werkt

Achter elke hit van de OpenInsect-app zit een hele pijplijn van klassieke signaalverwerking en moderne patroonherkenning. Het pad van het ruwe microfoonsignaal van uw smartphone naar de soortnaam kan worden opgesplitst in vier stappen: opname, tijd-frequentie-ontleding, extractie van kenmerken en classificatie. Als je eenmaal begrijpt wat er bij elke stap gebeurt, zie je een spectrogram met andere ogen.

Stap 1 – Van geluidsdruk naar tijdreeksen

De microfoon in de smartphone zet luchtdrukschommelingen om in een digitale reeks cijfers - meestal met een bemonsteringsfrequentie van 44,1 of 48 kHz. Voor vogelgezang is een aanzienlijk lager tarief echter voldoende: volgens Abeßer et al. is dat het belangrijkste energiebereik van gedomesticeerde zangvogels. (DEGA Akustik Journal 03/2025) tussen 2 en 8 kHz - individuele trillerelementen bereiken herhalingssnelheden tot 48 Hz. Bij een bemonsteringsfrequentie van 24 kHz bestrijkt de stelling van Nyquist (f_max = f_s/2) het gehele relevante frequentiebereik tot 12 kHz. Hogere bemonsteringsfrequenties zijn technisch mogelijk, maar bieden weinig aanvullende informatie voor zuivere soortidentificatie en genereren onnodig grote bestanden.

Stap 2 – Spectrogram via korte-tijd-Fourier-transformatie

Zodat de AI niet alleen het volume maar ook de toonhoogteprogressies kan 'zien', wordt het audiosignaal omgezet in een spectrogram. Wiskundig gezien gebeurt dit via de Short-Time Fourier Transform (STFT):

X(τ, f) = ∫ x(t) · w(t − τ) · e^−j2πft dt

Hier is x(t) het continue audiosignaal, w(t − τ) is een vensterfunctie (typisch Hann of Hamming) gecentreerd op het tijdstip τ, en X(τ, f) levert de complexe amplitude bij frequentie f. Het spectrogram is dan |X(τ, f)|².

Frommolt et al. (Vogelwarte 50, 2012) beschrijven de op FFT gebaseerde spectrogramberekening als het standaardhulpmiddel voor bio-akoestische patroonherkenning: De berekende spectrogrammen zijn niets anders dan matrices van amplitudewaarden in tijd- en frequentiedimensies. Alle volgende algoritmen werken op deze matrixrepresentatie.

Drie parameters bepalen de kwaliteit van het spectrogram:

Venstergrootte (FFT-lengte): Normaal gesproken 512 tot 2048 monsters. Grotere vensters geven een betere frequentieresolutie, kleinere geven een betere tijdresolutie – een klassieke afweging die Abeßer et al. (2025) beschrijven het expliciet als een “goede balans tussen tijd- en frequentieresolutie”.
Vensterfunctie: Hamming of Hann verminderen de spectrale lekkage aan de raamranden.
Hopgrootte: De tijdsverschuiving tussen opeenvolgende vensters, doorgaans 25-50% van de venstergrootte. Kleinere hopgroottes leveren vloeiendere spectrogrammen op, maar kosten rekentijd.

Stap 3 – Mel-schaal en MFCC's

Lineaire frequentieassen zijn onnatuurlijk voor het gehoor van mensen (en ook van vogels). Beide hoorsystemen kunnen lage frequenties fijner onderscheiden dan hoge. De Mel-schaal vertegenwoordigt deze perceptie wiskundig:

m = 2595 · log₁₀(1 + f/700)

Hieruit worden Mel-Frequency Cepstral Coefficients (MFCC's) berekend - oorspronkelijk overgenomen uit spraakherkenning, nu ook standaard in de bio-akoestiek. Krüger (HfM Weimar, WiSe 22/23) gebruikt 13 MFCC's als kenmerkvector in haar onderzoek naar automatische vogelzangherkenning en ontdekt dat het verhogen ervan naar 20 niet langer een significant effect heeft op de hitrate - een nuttige tip voor de dimensionering van slanke modellen.

Abeßer et al. (DEGA 2025) benadrukken dat MFCC's "spectrale eigenschappen van een audiosignaal vastleggen in een door mensen hoorbaar frequentiebereik" en daarom bijzonder effectief zijn voor tonale dierengeluiden, terwijl eenvoudige tijddomeinkenmerken zoals kortetermijnenergie of nuldoorgangssnelheid ontoereikend blijven in complexe geluidsscènes.

Stap 4 – Classificatie: van CNN naar Foundation Model

Op patroonherkenningsniveau hebben drie generaties elkaar de afgelopen tien jaar vervangen:

Klassieke algoritmen zoals de spectrogramcorrelatie (Frommolt et al. 2012, zie bibliografie voor formule) vergelijken onbekende opnames met referentiesjablonen. Identieke spectrogrammen geven een correlatiecoëfficiënt van 1; hoe hoger de waarde, hoe meer de oproepen op elkaar lijken. Er werd ook gebruik gemaakt van Verborgen Markov-modellen (HMM's) en willekeurige bossen.
Convolutionele Neurale Netwerken (CNN's), vooral BirdNET van Cornell University, behandelen het spectrogram als een beeld en leren hiërarchisch steeds complexere tijdfrequentiepatronen: eerst horizontale (harmonische) en verticale (transiënte) structuren, daarna volledige oproepmotieven. Abeßer et al. (2025) beschrijven deze hiërarchische kenmerkvorming vandaag de dag als de dominante benadering.
Transformer- en Foundation-modellen gebruiken zelfaandacht en kunnen langere tijdelijke afhankelijkheden vastleggen. Huidige audio-spraakmodellen zoals NatureLM-Audio zijn speciaal ontwikkeld voor de analyse van dierengeluiden en kunnen volgens het DEGA-overzicht zelfs zeldzame of bedreigde diersoorten classificeren.

Status van het onderzoek – in termen van nauwkeurigheid en beperkingen

Drie artikelen geven een goed overzicht van de huidige stand van kennis op het gebied van automatische vogelzangherkenning. We parafraseren de centrale uitspraken met verwijzing naar de bron:

Frommolt et al., Vogelwarte 50 (2012) – de methodologische basis

Het overzichtsartikel "Geautomatiseerde methoden voor het opnemen van oproepen en liedjes" is tot op de dag van vandaag een van de meest geciteerde Duitstalige referenties over dit onderwerp. Drie bevindingen zijn bijzonder relevant voor de praktijk:

Met gevoelige microfoons bereikt een geluidsopname hetzelfde bereik als het menselijk gehoor - een vergelijkend onderzoek van Hobson et al. (2002) vonden in het gemengde Boreale Bos een overeenkomst van 83-97% tussen veld- en opnamebepalingen.
Spectrogramcorrelatie werkt heel goed met duidelijk gestructureerde oproepen: voor de karekiet (Locustella luscinioides) behaalde de methode een detectiepercentage van 92% met slechts 1,2% verkeerde interpretaties (Bardeli et al. 2010, geciteerd in het overzicht van het vogelobservatorium).
In het geval van sterk overlappende oproepen van verschillende soorten daalt het aantal treffers drastisch. Buxton & Jones (2012) rapporteren slechts 10% herkende oproepen in dergelijke polyfone situaties. Dit is de wetenschap achter waarom een rustige opnameomgeving zo belangrijk is.

Krüger, HfM Weimar (winter 22/23) – het praktijkvoorbeeld

Sophie Krüger documenteert in haar projectwerk "Automatische herkenning van vogelzang" de constructie van een complete vogelzangdetector gebaseerd op de DCASE "Bird Audio". Detection Challenge"-dataset. Drie bevindingen zijn leerzaam voor onze app-ontwikkeling:

Met 13 MFCC's als functies en een willekeurige bosclassificatie behaalt een eenvoudig model een trefferpercentage van ongeveer 75% met 200 trainingsbestanden - ruim boven de 50% willekeurige basislijn van een binaire classificatie, maar nog steeds te laag voor praktisch gebruik.
Het vergroten van de dataset naar 500 of 1000 bestanden leidde in dit onderzoek niet automatisch tot een betere herkenning - een indicatie dat de kwaliteit en diversiteit van de trainingsgegevens belangrijker is dan pure kwantiteit.
De auteur besluit expliciet met de aanbeveling dat de tijdsopgeloste informatie van het Mel-spectrogram (in plaats van tijdsgemiddelde MFCC's) het hitpercentage verder zou moeten verbeteren - precies het pad dat moderne CNN's en Foundation-modellen hebben gevolgd.

Abeßer, Loekasjevitsj, Ziegler & Bös, DEGA Akustik Journal 03/2025

Het overzichtsartikel "Vooruitgang in de automatische herkenning van vogelzang" van Fraunhofer IDMT vat de stand van de techniek in 2025:

Vogelzang bevindt zich akoestisch in het frequentiebereik 2-8 kHz. Trillende elementen van individuele soorten bereiken herhalingsfrequenties tot 48 Hz. Traditionele signaalverwerkingsmethoden bereiken hier hun grenzen.
Per-Channel Energy Normalization (PCEN) heeft zichzelf bewezen als een effectieve nabewerking van spectrogrammen: het filtert windruis onder 500 Hz weg, balanceert de energieverdeling over het frequentiebereik en benadrukt de frequentiecontouren die relevant zijn voor detectie.
Volgens de IUCN Rode Lijst 2025 is 12% van alle vogelsoorten wereldwijd bedreigd of met uitsterven bedreigd. Geautomatiseerde bio-akoestische monitoring (Passive Acoustic Monitoring, PAM) is daarom niet langer een nice-to-have, maar een centraal instrument in natuurbeschermingsonderzoek.
Huidige onderzoeksdatasets zoals BirdSet (meer dan 6.800 uur audio, bijna 10.000 lessen) en Xeno-Canto (meer dan 450.000 opnames, meer dan 10.000 vogelsoorten) vormen de trainingsbasis voor moderne modellen.

Hübner, Universiteit van Potsdam (2006/2008) – het methodisch diep boren

Sebastian Hübner's proefschrift "Kennisgebaseerde modellering van audiosignaalclassificatoren - over de bio-akoestiek van Tursiops truncatus" is ontwikkeld aan de hand van het voorbeeld van de tuimelaar, maar beschrijft een compleet, overdraagbaar raamwerk voor de machinale annotatie van bio-akoestische opnames. Drie bevindingen zijn direct waardevol voor de herkenning van vogelzang:

Robuustheid tegen achtergrondgeluiden: In een gecontroleerd onderzoek naar synthetische fluitgeluiden daalden de nauwkeurigheid en precisie van spectrografische classificaties pas significant bij een signaal-ruisverhouding onder −30 dB (hoofdstuk 5.5). Tot deze waarde bleef het trefferpercentage consistent hoog - een indicatie dat op spectrogrammen gebaseerde methoden geen studio-opnames nodig hebben om betrouwbaar te classificeren.
Polyfonietolerantie gekwantificeerd: Volgens Hübner behaalde de geteste classificatiegroep met een gemiddelde van drie gelijktijdige fluitgeluiden in één opname nog steeds 79% nauwkeurigheid met 100% precisie (hoofdstuk 5.6). Pas na vier of meer overlays daalden de prestaties aanzienlijk. Voor onze toepassing betekent dit: twee zingende vogels zijn geen probleem, maar een ochtendkoor met vijf gelijktijdige zangers wel.
Visualisatie als wetenschappelijk hulpmiddel: Met behulp van contrastgeoptimaliseerde kleurenpaletten laat Hübner zien dat zorgvuldig geselecteerde kleurcodering het zichtbare waardebereik van een spectrogram met een factor drie vergroot vergeleken met pure grijswaardenweergave (hoofdstuk 3.2). Fijne boventonen die in grijstinten onzichtbaar blijven, kunnen worden onderscheiden door een koud-warm contrast in het middenwaardenbereik - precies het principe achter de hedendaagse gangbare perceptie-uniforme paletten zoals viridis, magma of inferno.

Methodologisch onderstreept het werk twee principes die van toepassing zijn op elke classificatiepijplijn: ten eerste de scheiding van signaturen van akoestische verschijnselen (kennis) en algoritmen voor patroonherkenning (technologie) - een geheel van kennis dat is geformaliseerd als een compacte handtekening, overleeft veranderingen in de onderliggende modellen (klassieke correlatiedetector → CNN → Foundation-model) zonder verlies van informatie. Ten tweede de observatie dat logaritmische spectrogrammen een aanzienlijk betere selectiviteit bieden voor stille structuren dan lineaire amplitudewaarden - een stap die moderne pijpleidingen ook consequent uitvoeren vóór Mel-schaling.

Wat moeilijk blijft

Ondanks alle vooruitgang blijven er drie problemen bestaan die zelfs OpenInsect niet op magische wijze kan oplossen:

Polyfonie: wanneer meerdere vogels tegelijkertijd zingen, daalt het herkenningspercentage soms tot 10% (Frommolt et al. 2012). Huidig onderzoek naar op AI gebaseerde bronscheiding (BioCPPNet en anderen) belooft verbetering.
Zwakke signaal-ruisverhouding: wind, verkeer, water en andere dieren maskeren de vogelroep. Domeinaanpassing en PCEN compenseren dit gedeeltelijk, maar slechts gedeeltelijk.
Dialectvariatie: Vogels vertonen regionale zangdialecten. Walcott et al. (2006) lieten op de gewone duiker (Gavia immer) zien dat oproepstructuren veranderen, zelfs als het territorium verandert - een model dat alleen was getraind op "standaardopnamen" mislukt hierdoor.

Hoe OpenInsect wetenschappelijke best practices implementeert

OpenInsect combineert verschillende van de hierboven beschreven methoden tot een pragmatische pijplijn die in één stap zowel akoestische classificatie als visualisatie produceert:

Modellaag: Foundation in plaats van klassieke CNN

In plaats van een gespecialiseerd BirdNET CNN vertrouwen we op een multimodaal basismodel met native audio-invoer, ingebed in onze eigen AI-pijplijn van voorverwerking, classificatie en contextanalyse. Deze architectuur heeft twee voordelen ten opzichte van klassieke dieren-CNN's:

Het kan context verwerken: GPS-positie, tijdstip, temperatuur, vochtigheid en zelfs gebruikersnotities vloeien als tekst in dezelfde gevolgtrekking over. Hierdoor kunnen regionaal onwaarschijnlijke soorten automatisch worden verlaagd.
Het werkt voor alle soorten: vogels, uilen, kikkers, krekels en krekels worden door hetzelfde model herkend - zonder dat er voor elke diergroep een aparte classificatie nodig is. Dit komt overeen met dat van Abeßer et al. (DEGA 2025) vermeldde de trend naar “geluidsherkenning tussen soorten”.

Verwerking van audiogegevens aan de serverzijde

Voordat het model zelfs maar begint te classificeren, ondergaat elke opname een voorbewerking, die rechtstreeks is afgeleid van de hierboven geciteerde artikelen:

Luidheidsnormalisatie naar −18 LUFS volgens EBU R128, zodat opnames van verschillende afstanden kunnen worden vergeleken.
Hoogdoorlaatfilter op 80 Hz tegen wind en verkeersgerommel - precies het frequentiebereik waarin volgens het DEGA-artikel het sterkste achtergrondgeluid optreedt.
Stilteverwijdering met een drempel van −40 dB zodat het model zich concentreert op de daadwerkelijke gesprekspassages.
Spectrogramcreatie met FFmpeg `showspectrumpic`, viridis-kleurenpalet, frequentieband 0-12 kHz, lineaire schaal. Het resultaat is de afbeelding die je ziet na elke hit in je bericht.

Contextverrijking

Bij het uploaden stuurt de app niet alleen de audio mee, maar ook een compacte contexttabel: GPS-coördinaten (voor regionale plausibiliteit), tijdstip (uilen klinken 's ochtends anders dan 's nachts), weergegevens (wind verklaart achtergrondgeluid) en - indien beschikbaar - observatienotities. Deze gegevens verminderen de effectieve set classificatieklassen dramatisch en verhogen zo de top-1-nauwkeurigheid aanzienlijk zonder dat het model zelf opnieuw hoeft te worden getraind.

Best practices voor visualisatie: waarom onze spectrogrammen er uitzien zoals ze eruitzien

Een spectrogram is niet alleen een afbeelding voor de optica - het is een wetenschappelijk diagram waarvan de assen, schalen en kleuren informatie overbrengen. Er worden bewust vier ontwerpbeslissingen genomen achter de OpenInsect-spectrogrammen:

Lineaire frequentie-as in plaats van logaritmisch

Voor klassieke zangvogels met een hoofdband van 2-8 kHz is een lineaire frequentie-as gemakkelijk te lezen - de zangband neemt een groot, gelijkmatig weergegeven deel van de grafiek in beslag. Een logaritmische schaal zou lage frequenties (onder 500 Hz) overschatten, ook al is dat meestal alleen maar wind- of verkeersgeluid. Voor laagfrequente uilengeluiden of grote vogels kan een Mel-schaal echter zelfs beter zijn - een mogelijke toekomstige weergavemodus.

Frequentiebereik 0-12 kHz

De bovengrens komt van de stelling van Nyquist bij 24 kHz sampling. Hogere frequenties zijn niet relevant voor de identificatie van vogelsoorten – Frommolt et al. (2012) en Abeßer et al. (2025) bevestigen beide dat de hoofdband net onder de 10 kHz eindigt.

Viridis in plaats van Jet

Het viridis-kleurenpalet is perceptueel uniform - gelijke kleurafstanden komen overeen met gelijke energieafstanden. Het oude “jet”-palet (blauw → cyaan → groen → geel → rood) zorgt voor optische sprongen die niet in het signaal zitten en is bovendien moeilijk leesbaar voor mensen die rood-groenblind zijn. Wetenschappelijke bio-akoestische software is de afgelopen jaren grotendeels overgestapt op viridis (of magma/inferno).

Trade-off tussen tijd en frequentie

We gebruiken de standaardinstellingen van FFmpeg (venstergrootte ca. 2048 samples, hopgrootte 25%) - dit is een bewust compromis tussen frequentie en tijdresolutie, waardoor zowel snelle trillers als lange fluittonen herkenbaar zijn. Voor onderzoeksanalyses met hoge resolutie (bijvoorbeeld van trillersnelheden tot 48 Hz, zoals beschreven in Podos 1997 en DEGA 2025) zou een kleinere venstergrootte zinvol zijn - dit is een punt waarop we nog kunnen optimaliseren.

Bronnen en verder lezen

Als je dieper wilt ingaan op de wetenschappelijke basis van automatische vogelzangherkenning, raden we de volgende gratis beschikbare primaire bronnen aan:

Frommolt, K.-H., Hüppop, O., Bardeli, R., Hill, R., Koch, M., Tauchert, K.-H. & Specht, R. (2012): Geautomatiseerde methoden voor het opnemen van oproepen en liedjes in avifaunistisch veldonderzoek. Vogelwarte 50, blz. 65-78. PDF (Zobodat)
Krüger, S. (winter 22/23): Automatische herkenning van vogelzang. Projectwerk in het kader van “AI-ondersteunde geluidsanalyse”, Franz Liszt Hochschule für Musik Weimar (Prof. Dr. Pfleiderer / Prof. Abeßer). PDF (HfM Weimar)
Abeßer, J., Loekasjevitsj, H., Ziegler, S. & Bös, J. (2025): Vooruitgang in automatische herkenning van vogelzang. Akustik Journal 03/2025 (Duitse Vereniging voor Akoestiek), blz. 7–16. PDF (DEGA Akustik)
Hübner, S. (2006/2008): Op kennis gebaseerde modellering van audiosignaalclassificatoren – over de bio-akoestiek van Tursiops truncatus. Proefschrift, Faculteit der Menswetenschappen van de Universiteit van Potsdam, 2e, herziene editie, University Press Potsdam. PDF (Universiteit van Potsdam)

Aanbeveling voor wetenschappers en burgerwetenschappers: Geanonimiseerde OpenInsect-opnames met spectrogram- en contextgegevens (GPS, weer, betrouwbaarheidsscore) kunnen goed worden gebruikt voor het valideren van eigen modellen of voor biodiversiteitsanalyses. Als u geïnteresseerd bent in een gestructureerde data-export, kunt u contact met ons opnemen via de app - wij zien onszelf als een burgerwetenschapsplatform analoog aan Xeno-Canto en Macaulay Library, met als extra meerwaarde dat elke opname al een spectrogramvisualisatie bevat.

OpenInsect nu gratis downloaden

Probeer zelf vogelzangherkenning – OpenInsect is beschikbaar voor iOS en Android:

Met elke upload voed je het model met echte observatiegegevens en word je onderdeel van een groeiende gemeenschap van natuurliefhebbers, hobby-ornithologen en burgerwetenschappers.

Ingediend in: App, Bioakustik, KI, Spektrogramm, Vogelgesang, Vogelstimmen, Wissenschaft