Gregor Baumart Erstellt am 26.03.2026 Lesedauer: ca. 12 Min

Raspberry Pi als Lausch- bzw. Forschungsstation, Teil 1

Vogelstimmen erkennen mit BirdNet und Raspberry Pi – Grundlagen & Hardware

Vielleicht kennen Sie diese Situation: Ein Vogel singt wunderschön, und Sie fragen sich, welche Art sich dahinter verbirgt. Evtl. zücken Sie sogar Ihr Smartphone, um den Sänger mithilfe einer App zu bestimmen. Doch was, wenn sich alle Vögel im eigenen Garten, auf dem Balkon oder rund um die Schule erfassen ließen – 24 Stunden am Tag, sieben Tage die Woche? Mit wenigen Komponenten lässt sich solch eine eigene Lauschstation aufbauen, die kontinuierlich ihre Umgebung „abhört“ und die gefundenen Vogelarten automatisch dokumentiert.

Im Zentrum dieses Projekts steht ein Raspberry Pi, der mithilfe der BirdNET-KI Vogelstimmen erkennt, klassifiziert und protokolliert. Das Projekt eignet sich ideal für Technikbegeisterte, Naturfreunde oder Schulen, die künstliche Intelligenz und Biodiversität praktisch erleben möchten. Welche Hardware benötigt wird, welche Raspberry-Pi-Modelle sich eignen und wie die Installation sowie der Betrieb funktionieren, zeigt dieser Artikel Schritt für Schritt in zwei Teilen.
Teil 1 behandelt Grundlagen und Hardware der BirdNET-Lauschstation, Teil 2 widmet sich der Software, Einrichtung und Auswertung der erfassten Daten.

Wie funktioniert BirdNET?

BirdNET ist ein Forschungs- und Open-Source-Projekt, das Vogelstimmen mithilfe künstlicher Intelligenz automatisch erkennt. Ziel ist es, akustisches Monitoring für Naturbeobachtung und Naturschutz einfach zugänglich zu machen. Viele Vogelarten sind akustisch leichter nachweisbar als visuell, weshalb Tonaufnahmen besonders gut zur Erfassung von Arten geeignet sind. BirdNET nutzt ein neuronales Netz, das mit zahlreichen Vogelrufen pro Art trainiert wurde. Die Software zerteilt lange Aufnahmen in kurze Segmente, erkennt typische Klangmuster und ordnet diese einer Vogelart mit entsprechender Wahrscheinlichkeit zu. Dadurch können auch kurze Gesangsphasen, Hintergrundgeräusche oder seltene Rufe zuverlässig ausgewertet werden, ohne dass eine manuelle Auswertung erforderlich ist.

Von Ton zu Art: Wie BirdNET Vogelstimmen identifiziert

Die KI von BirdNET erkennt Vogelstimmen, indem sie Audioaufnahmen in sogenannte Spektrogramme umwandelt – also in Bilder, die den Klang visuell darstellen. Auf der x-Achse ist die Zeit abgetragen, auf der y-Achse die Frequenz: tiefe Töne unten, hohe Töne oben. Die Helligkeit der Linien gibt die Lautstärke der jeweiligen Frequenzen an. Am Beispiel der Rufe von Zilpzalp und Kuckuck lässt sich dieses Prinzip gut nachvollziehen (Bild 2).

Der Ruf des Zilpzalps beginnt bei etwa 7 kHz und fällt über rund 5 kHz auf etwa 4 kHz ab. Der zweite Rufteil, das „Zilp-zalp“, startet erneut bei etwa 7 kHz, fällt jedoch deutlich steiler auf rund 4 kHz ab und wirkt für unser Gehör dadurch tiefer.

Der Ruf des Kuckucks ist zweisilbig („Ku–kuck“) und liegt mit einer Grundfrequenz von etwa 484 Hz deutlich tiefer. Im Spektrogramm sind zudem harmonische Vielfache erkennbar, beispielsweise bei rund 887 Hz und 1700 Hz, die dem Ruf seinen charakteristischen Klang verleihen.

Das Zwitschern, Rufen oder Trillern eines Vogels wird so zu einem klaren Muster, das für eine künstliche Intelligenz maschinenlesbar ist. Die KI vergleicht diese Muster mit einem trainierten neuronalen Netz, das zuvor Tausende Vogelrufe jeder Art „gesehen“ hat. So kann sie die singenden und rufenden Vogelarten in der Aufnahme mit einer Wahrscheinlichkeit vorhersagen.

Kurz gesagt: Ton → Spektrogramm → Mustererkennung durch KI → Vogelart erkannt. Dieses Prinzip wird sowohl in der Smartphone-App als auch in stationären Lauschstationen angewendet.

Dauerhaft Vogelstimmen erkennen und aufnehmen mit BirdNET und Raspberry PI

Als Lösung für die gelegentliche Datenerfassung reicht die Smartphone-App von BirdNET (Bild 1) zwar aus, sie stößt jedoch beim dauerhaften Monitoring an ihre Grenzen. Eine stationäre BirdNET-Lauschstation auf Basis eines Raspberry Pi arbeitet rund um die Uhr, erfasst Daten automatisch und erstellt vollständigere Datensätze – von selten rufenden Arten über nachtaktive Vögel bis hin zu nächtlichen Überflügen. Solche passiven Bioakustik-Messungen ermöglichen die langfristige Beobachtung von Vogelaktivitäten, Bewegungsmustern und saisonalen Veränderungen. Typische Einsatzorte reichen vom eigenen Garten oder Balkon bis zu Streuobstwiesen oder Naturschutzgebieten. Optional können die erfassten Daten an BirdWeather übermittelt werden, eine globale Plattform zur Sammlung und Visualisierung von Vogelrufen. So wird die Lauschstation Teil eines weltweiten Netzwerks, sie unterstützt Citizen-Science-Projekte und setzt lokale Beobachtungen in einen größeren ökologischen Kontext. Die Entwicklung von BirdNET wird von internationalen Forschungseinrichtungen und Förderprogrammen unterstützt und basiert auf der Zusammenarbeit von Wissenschaft, Industrie und einer offenen Community. Mehr über BirdNET erfahren Sie hier.

Bild 1: Smartphone-App: Die BirdNET-App im Einsatz auf einem Smartphone

Bei Citizen-Science-Plattformen handelt es sich um digitale Plattformen, über die Menschen – auch ohne wissenschaftliche Ausbildung – aktiv an Forschungsprojekten mitwirken können. Diese können aus unterschiedlichen Bereichen kommen, wie Umwelt, Astronomie, Medizin, Klimaforschung oder Kultur. Aufgaben in einem solchen Projekt können z. B. das Sammeln von Daten (wie hier bei BirdNET dem Erkennen von Vogelstimmen), die Datenanalyse (z. B. Muster auf Satellitenbildern erkennen) oder die Meldung von Beobachtungen (z. B. Blütezeiten von verschiedenen Pflanzen für die Klimaforschung) sein.

Was braucht es für eine BirdNET-Lauschstation?

Für den Aufbau einer BirdNET-Station auf Basis eines Raspberry Pi werden nur wenige Komponenten benötigt. In der Minimalversion umfasst die Ausstattung neben der Stromversorgung lediglich einen Raspberry Pi mit microSD-Karte und ein Mikrofon. Bei der Wahl des Mikrofons und der Einrichtung für den Dauerbetrieb bleibt jedoch viel Spielraum für individuelle Anpassungen und Erweiterungen, sodass sich die Station leicht an unterschiedliche Einsatzszenarien und Projekte anpassen lässt.

Der passende Raspberry Pi

Falls kein Raspberry Pi vorhanden ist und ein Betrieb am Stromnetz geplant ist, empfiehlt sich der aktuelle Raspberry Pi 5, wobei bereits das 2-GB-RAM-Modell ausreichend ist. Zwar läuft die eigentliche Echtzeit-Erkennung von BirdNET auch auf älteren Raspberry-Pi-Modellen zuverlässig, der Raspberry Pi 5 bietet jedoch eine deutlich höhere Rechenleistung. Dies macht sich insbesondere bei der Weboberfläche bemerkbar: Spektrogramme werden flüssiger dargestellt und die Bedienung reagiert spürbar schneller. Sollte der Raspberry Pi zu Hause noch für andere Funktionen genutzt werden, kann man sich überlegen, auf ein Modell mit mehr RAM zu setzen.

Als Alternative eignet sich der Raspberry Pi 4B mit idealerweise 4 GB RAM. Auch hier ist eine gute Performance erreichbar, insbesondere wenn optional ein moderates Overclocking der CPU aktiviert wird.

Als Mindestkonfiguration können ein Raspberry Pi 3B+ oder ein Raspberry Pi Zero 2 eingesetzt werden. Diese Systeme bewältigen die grundlegende Erkennung zuverlässig, zeigen jedoch Einschränkungen bei der Reaktionsgeschwindigkeit der Weboberfläche und stoßen bei erweiterten Analysefunktionen oder mehreren parallelen Streams schneller an ihre Leistungsgrenzen. Ihr großer Vorteil liegt jedoch im geringeren Stromverbrauch, was diese Modelle neben dem günstigeren Preis als mobile Varianten oder Geräte im Feldeinsatz attraktiv macht.

SD-Speicherkarte

Für den Dauerbetrieb empfiehlt sich eine microSD-Karte mit mindestens 64 GB Kapazität. Wichtig ist weniger die maximale Geschwindigkeit (V30 reicht), als vielmehr eine hohe Schreibfestigkeit. Ideal sind Karten, die als „High Endurance“, „Surveillance Grade“ oder „Dashcam Rated“ gekennzeichnet sind. Sie sind speziell für den 24/7-Betrieb ausgelegt. Bewährt haben sich unter anderem SanDisk High Endurance, Samsung PRO Endurance oder Western Digital Purple SC.

Um Performance und Lebensdauer der microSD-Karte zu erhalten, sollte deren Belegung dauerhaft unter 80 Prozent bleiben. Werden viele Audioaufnahmen langfristig archiviert, empfiehlt sich alternativ oder ergänzend ein externes USB-Speichermedium oder NAS, um die microSD-Karte zu entlasten.

Mikrofon

Das Mikrofon ist eine zentrale Komponente der BirdNET-Lauschstation, da die Qualität der Audioaufnahmen die Erkennungsgenauigkeit und Zuverlässigkeit der Vogelstimmenanalyse beeinflusst. Zudem kann man mit der Wahl des Mikrofons das System an den jeweiligen Einsatzzweck und die örtlichen Gegebenheiten anpassen, um optimale Ergebnisse zu erzielen.

Die Wahl des geeigneten Mikrofons hängt maßgeblich vom Einsatzort und den spezifischen Anforderungen ab. USB-Mikrofone überzeugen durch ihre einfache Inbetriebnahme, während I²S-MEMS-Mikrofone besonders effizient sind und sich für den Dauerbetrieb eignen. Externe Soundkarten und hochwertige Spezialmikrofone liefern eine sehr hohe Audioqualität, verursachen jedoch höhere Kosten und erfordern zusätzlichen Aufwand bei der Einrichtung sowie beim Schutz vor Umwelteinflüssen. Dieses Beispiel zeigt, dass selbst ein scheinbar einfaches Projekt zahlreiche weiterführende Forschungs- und Experimentierfelder eröffnet – von Mikrofontechnik über Signalverarbeitung bis hin zur Optimierung akustischer Erfassungsmethoden.

USB-Mikrofone

USB-Mikrofone stellen die einfachste und kostengünstigste Variante dar. Sie lassen sich besonders einfach an einem Raspberry Pi betreiben, da sie in der Regel ohne zusätzliche Treiber erkannt werden. Sie eignen sich gut für den schnellen und erfolgreichen Einstieg und liefern bereits eine solide Aufnahmequalität. Nachteilig sind der etwas erhöhte Stromverbrauch sowie die begrenzten Möglichkeiten durch die vorgegebene Kabellänge und Einschränkungen bei der Audioqualität.

I^²S-MEMS-Mikrofone

I^²S-MEMS-Mikrofone sind speziell für den Einsatz mit Einplatinencomputern wie dem Raspberry Pi konzipiert und werden direkt über die GPIO-Pins angeschlossen. Die digitale Audioübertragung erfolgt über die digitale I^²S-Schnittstelle – nicht zu verwechseln mit I²C – die für kontinuierliche Audiodaten mit geringer Latenz ausgelegt ist.

Bei MEMS-Mikrofonen (Micro-Electro-Mechanical-Systems) handelt es sich um mikroelektromechanische Bauelemente, bei denen die eigentliche Mikrofonmembran direkt in Silizium integriert ist. Dadurch entstehen äußerst kompakte, robuste und temperaturstabile Mikrofone, die unempfindlich gegenüber Erschütterungen sind und über eine gleichbleibende Audioqualität verfügen. Diese werden z. B. in Smartphones eingesetzt. Das Audiosignal wird bereits im Mikrofon digitalisiert, was Störeinflüsse auf der Leitung deutlich reduziert.

I^²S-MEMS-Mikrofone zeichnen sich durch einen sehr geringen Stromverbrauch, eine kleine Bauform und eine hohe Langzeitstabilität aus und eignen sich somit besonders für den dauerhaften 24/7-Betrieb. Der Einrichtungsaufwand ist jedoch höher: Neben Anpassungen auf Betriebssystemebene sind häufig Lötarbeiten sowie zusätzlicher mechanischer Aufwand für die Integration in ein Gehäuse erforderlich.

Im Hinblick auf den Außeneinsatz sind MEMS-Mikrofone durchaus empfindlich gegenüber direkter Feuchtigkeit und Kondensation. Für den Dauerbetrieb im Freien ist daher ein geeigneter Schutz erforderlich, etwa durch wasserabweisende, akustisch durchlässige Membranen sowie ein gut belüftetes und wettergeschütztes Gehäuse.

USB-Soundkarte mit Mikrofoneingang

Eine USB-Soundkarte mit externem Mikrofoneingang bietet hohe Flexibilität bei der Mikrofonwahl. So lassen sich auch höherwertige oder bereits vorhandene Mikrofone weiterverwenden. Dies resultiert jedoch in einen zusätzlichen Hardwareaufwand sowie einen etwas höheren Energiebedarf. Mit dieser Konfiguration lassen sich auch hochwertige Richtmikrofone einsetzen.

Gerne wird dabei auf das Røde VideoMic NTG zurückgegriffen, das ursprünglich für den Videodreh entwickelt wurde. Durch seine Supernieren-Richtcharakteristik nimmt das Mikrofon bevorzugt Schall aus der nach vorne ausgerichteten Richtung auf, während seitliche und rückwärtige Geräusche deutlich abgeschwächt werden. Dadurch werden Umgebungsgeräusche reduziert und gezielte Aufnahmen ermöglicht. Solche Mikrofone eignen sich besonders für gezielte Beobachtungen, sind jedoch vergleichsweise kostenintensiv und für den dauerhaften Outdoorbetrieb nur dann sinnvoll, wenn sie zuverlässig vor Witterungseinflüssen geschützt werden können.

Eigenbau: Elektretmikrofon

Elektretmikrofone eignen sich besonders für Eigenbauprojekte, vor allem für Anwender, die sich intensiver mit Mikrofontechnik und analoger Signalverarbeitung beschäftigen möchten. Sie sind kostengünstig, weitverbreitet und lassen sich mit einfachen Vorverstärkerschaltungen in Kombination mit einer USB-Soundkarte oder einem Audio-ADC am Raspberry Pi betreiben. Für den dauerhaften Außeneinsatz sind Elektretmikrofone jedoch nur bedingt geeignet, da sie empfindlich gegenüber Feuchtigkeit und Temperaturschwankungen sind.

RTSP-Stream anstatt Mikrofon

Statt eines direkten Mikrofoneingangs kann auch der bestehende Videostream einer Kamera zur Vogelstimmerkennung genutzt werden. Darüber hinaus ist es möglich, mit zusätzlichen Komponenten ein Funkmikrofon zu realisieren, wodurch auf eine Kabeldurchführung verzichtet werden kann. Weitere Informationen zu diesem Projekt finden Sie hier.

Stromversorgung

Für einen stabilen und störungsfreien Betrieb der BirdNET-Lauschstation ist die richtige Stromversorgung entscheidend. Je nach Einsatzzweck stehen verschiedene Optionen zur Verfügung.

Netzteil für stationären Betrieb

Für den Betrieb zu Hause „auf der Fensterbank“ empfiehlt sich das offizielle Netzteil des jeweiligen Raspberry-Pi-Modells:

Raspberry Pi 5: 5,1  V/5 A USB-C
Raspberry Pi 4: 5,1 V/3 A USB-C
Raspberry Pi 3: 5 V/2,5 A Micro-USB

Die offiziellen Netzteile liefern bewusst 5,1 V, um Spannungsverluste auszugleichen, bieten eine bessere Abschirmung gegen elektromagnetische Störungen (EMI) und hochfrequente Funkstörungen (RFI) und reduzieren somit Störungen bei der Audioaufnahme. Zudem sind sie exakt auf die Stromanforderungen des Raspberry Pi unter Last ausgelegt. Der Einsatz ungeeigneter Netzteile kann zu Unterspannungswarnungen, Instabilitäten, Störgeräuschen und Aussetzern im Betrieb führen.

Der Stromverbrauch liegt modellabhängig typischerweise zwischen 3 und 8 W:

Raspberry Pi 3B+: ca. 3 W im Leerlauf, bis zu 5,5 W bei aktiver Analyse
Raspberry Pi 4B: ca. 4–6,5 W
Raspberry Pi 5: 5–8 W

Für ein angeschlossenes USB-Audiointerface oder Mikrofon sollten zusätzlich etwa 0,5 bis 1 W eingeplant werden.

Powerbank für mobilen Einsatz

Für mobile oder temporäre Installationen kann die BirdNET-Lauschstation über eine Powerbank mit ausreichender Ausgangsleistung betrieben werden. Dadurch sind Messungen unabhängig vom Stromnetz möglich, beispielsweise auf Exkursionen. So eine Powerbank mit 100 Wh kann einen Raspberry Pi 4B mit USB-Mikrofon etwa 14 Stunden am Stück betreiben.

Stromversorgung mit Solar und Batterie

Neben der klassischen Netzstromversorgung ist auch ein Betrieb mit Solarenergie und Akku möglich. Diese Variante eignet sich besonders für Langzeitstudien fernab des Stromnetzes und eröffnet neue Einsatzmöglichkeiten. Mit wenigen zusätzlichen Komponenten zur Energieverwaltung, einer geeigneten Solarzelle, einem Akku und einem wetterfesten Gehäuse lässt sich eine autarke BirdNET-Lauschstation realisieren, die über längere Zeiträume unabhängig betrieben werden kann – etwa in Naturschutzgebieten oder auf abgelegenen Flächen.

Damit sind die technischen Grundlagen gelegt: von der Funktionsweise der KI über die benötigte Hardware bis hin zu Mikrofonwahl, Stromversorgung und Einsatzszenarien. Bereits mit überschaubarem Aufwand lässt sich so eine leistungsfähige BirdNET-Lauschstation realisieren, die kontinuierlich Vogelstimmen erfasst und dokumentiert.

Doch die eigentliche Stärke des Systems zeigt sich erst im Betrieb: Genau darum geht es in Teil 2: Dort steht die Open-Source-Software im Mittelpunkt – von der Installation von BirdNET-Go über die Bedienung der Weboberfläche bis hin zu Analysefunktionen, Optimierungen für den Dauerbetrieb und der Einbindung in Citizen-Science-Plattformen wie BirdWeather.