ADAS

Computer Vision und autonome Systeme: Die Rolle von CNNs in der Bildverarbeitung

Aug 14, 2025

Content

Title

Title

Title

Authors

Matthias Brodtbeck

Data Analytics & Machine Learning Specialist

Farbod Vakili

Autonomous Systems

Simon Profuss

Autonomous Systems

Moderne Fahrzeuge erkennen Verkehrsschilder, Fußgänger oder andere Autos längst nicht mehr nur durch einfache Sensoren. Sie analysieren visuelle Daten in Echtzeit, um ihre Umgebung zu verstehen und entsprechend zu reagieren. Möglich machen das sogenannte Convolutional Neural Networks (CNNs). Aber wie funktionieren sie eigentlich und welche Herausforderungen führen zur Nutzung dieser neuronalen Netze?

Computer Vision: Bilderkennung & Features

Nehmen wir ein simples Beispiel: Wir möchten eine Bildklassifikation durchführen und herausfinden, welches Objekt auf diesem Bild zu sehen ist. Im Gegensatz zur Objekterkennung interessiert uns bei einer Bildklassifikation die Position des Objekts nicht, es geht vielmehr darum, den zu sehenden Objekten basierend auf vordefinierten Merkmalen eine bestimmte Klasse zuzuweisen.

Das Beispielbild hat eine Pixeldichte von 1000 x 1000 Pixel. Das bedeutet: 1.000.000 einzelne Pixel.

 

Im Bereich Computer Vision ist jeder Pixel ein sogenanntes Feature, also eine Variable, die von der KI für die jeweilige Aufgabe (z. B. Bildklassifikation) verwendet wird. 1.000.000 Features sind schon enorm und bei farbigen Bildern kommt es noch dicker: Mit drei Farbkanälen (rot, grün, blau) landen wir bei 3.000.000 Pixelwerten.

Diese hohe Anzahl an Features hat Folgen:

  1. Höhere Rechenkosten  → Mehr Features bedeuten komplexere Netze & mehr trainierbare Parameter.

  2. Höhere Speicherkosten → Mehr Features bedeuten eine höhere Dimension und eine höhere Anzahl benötigter Trainingsdaten (Stichwort Curse of Dimensionality).

  3. Höhere Personalkosten → Mehr Trainingsdaten müssen gelabelt werden, der Personalaufwand steigt.

Um diese Kosten zu senken, muss die Anzahl der Features reduziert werden, ohne dabei wesentliche Bildinformationen zu verlieren. Genau hier spielen Convolutional Neural Networks ihre Stärken aus.

Was sind CNNs?

Convolutional Neural Networks (CNN) sind eine spezialisierte Form künstlicher neuronaler Netze, die besonders für Bild- und Videoverarbeitung entwickelt wurden. Sie analysieren lokale Bildbereiche mithilfe von Filtern (sogenannten Kernels). Diese Filter „wandern“ über das Bild und erkennen dabei Muster wie Kanten, Formen oder Texturen unabhängig davon, wo diese im Bild auftreten.

 Ein typischer CNN-Aufbau besteht aus:

  • Convolutional Layers erkennen lokale Muster (z. B. horizontale/vertikale Kanten, Farbverläufe)

  • Pooling Layers verkleinern die Datenmenge, indem sie benachbarte Pixelwerte zusammenfassen, ohne relevante Informationen zu verlieren

  • Fully Connected Layers kombinieren die extrahierten Merkmale, um eine Klassifikation oder Entscheidung zu treffen

  • Je nach Aufgabe z. B. eine Softmax-Funktion, die für jede Klasse eine Wahrscheinlichkeit ausgibt

 Die Vorteile dieses Netzwerks liegen auf der Hand:

  1. Weniger Parameter durch lokale Filter und Parameter-Sharing → effizientere Berechnungen

  2. Automatische Merkmalsextraktion statt manueller Feature-Definition

  3. Translation Invariance  → ein Objekt wird auch erkannt, wenn es sich im Bild verschiebt

  4. Bessere Generalisierung durch reduzierte Komplexität

Dank dieser Eigenschaften sind CNNs heute die Grundlage moderner Fahrerassistenzsysteme – von der Verkehrszeichenerkennung bis hin zur Analyse komplexer Verkehrsszenarien.

Wenn euch Themen zu autonomen Systemen und Objekterkennung interessieren, dann verfolgt unsere nächsten Tech-Beiträge. Unter anderem schauen wir uns Convolutional Neural Networks im Detail an – und viele weitere spannende Themen.

CarByte

CarByte