Glossar/ Grundbegriffe

Dieses Glossar behandelt die wichtigsten Begriffe in der Welt der KI

A

A/B-Testing

Ein Verfahren, bei dem zwei Varianten (A und B) miteinander verglichen werden, um datenbasiert zu ermitteln, welche Variante bessere Ergebnisse liefert (z. B. höhere Klickrate oder höhere Genauigkeit bei einem KI-Modell). Im KI-Kontext wird A/B-Testing eingesetzt, um verschiedene Modellversionen mit realen Nutzern zu testen und die leistungsstärkere Variante zu wählen.


AI Act (KI-Verordnung)

Eine Gesetzgebung der EU, die klare, verbindliche Regeln für Entwicklung und Einsatz von KI festlegt, basierend auf Risikoklassen (z. B. Hochrisiko-KI in Medizin oder Justiz). Ziel ist es, Transparenz, Sicherheit und Datenschutz bei KI-Anwendungen zu gewährleisten. Unternehmen müssen ihre KI-Systeme entsprechend zertifizieren oder prüfen lassen.


Algorithmus

Eine klar definierte Vorgehensweise, um ein Problem zu lösen oder eine Aufgabe Schritt für Schritt abzuarbeiten. Ein Algorithmus ist nicht automatisch lernfähig; er folgt statisch den programmierten Regeln. Erst wenn Algorithmen sich auf Basis von Daten verbessern können (Maschinelles Lernen), spricht man von „Künstlicher Intelligenz“.


Automatisierung

Der Prozess, in dem Aufgaben oder Abläufe mithilfe von Technologie (z. B. KI oder RPA) ohne weiteres menschliches Eingreifen durchgeführt werden. So lassen sich wiederkehrende Tätigkeiten schneller, kostengünstiger und oft fehlerärmer erledigen.


B

Basismodell (Foundation Model)

Ein großes, vortrainiertes KI-Modell (z. B. ein umfassendes Sprach- oder Bildmodell), das als allgemeine Grundlage für viele unterschiedliche Aufgaben dient. Statt jedes Mal von null zu starten, kann man solch ein Modell mit weniger Aufwand auf spezielle Anwendungen feinabstimmen.


Bias (Voreingenommenheit)

Eine systematische Verzerrung in Daten oder Algorithmen, die zu diskriminierenden oder fehlerhaften Ergebnissen führt. Wenn z. B. ein KI-System für Bewerbungen mehrheitlich mit Daten von Männern trainiert wird, kann es weibliche Kandidatinnen ungewollt benachteiligen. Bias-Management ist daher ein wesentlicher Teil verantwortungsvoller KI-Entwicklung.


Big Data

Sehr große, schnell wachsende und komplexe Datenmengen, die sich mit herkömmlichen Methoden kaum bearbeiten lassen. Big Data bildet oft die Basis für KI-Projekte, da umfangreiche Trainingsdaten die Leistung von Modellen verbessern können.


C

Chatbot

Ein Programm, das über Text (oder Sprache) mit Menschen interagiert und dabei natürliche Sprache verarbeitet. Moderne Chatbots basieren häufig auf NLP und können rund um die Uhr automatisierte Antworten geben (z. B. im Kundenservice).


Clustering

Ein unüberwachtes Lernverfahren, bei dem Datenobjekte in Gruppen (Cluster) eingeteilt werden, die sich in bestimmten Merkmalen ähneln. Clustering identifiziert Strukturen oder Ähnlichkeiten in Daten, ohne dass man vorher Kategorien definiert (etwa Kunden-Segmente).


Computer Vision (Bildverarbeitung)

Ein Teilgebiet der KI, das Maschinen beibringt, Bilder oder Videos zu analysieren und darin Objekte, Gesichter oder andere Muster zu erkennen. Typische Anwendungen sind Gesichtserkennung, Qualitätskontrollen in der Industrie oder automatisiertes Auslesen von Dokumenten.


D

Data Lake

Ein zentrales Repository, in dem rohe, unstrukturierte, halbstrukturierte und strukturierte Daten gespeichert werden, ohne sie vorab zu transformieren. Ein Data Lake ermöglicht flexiblere Analysen und KI-Anwendungen, da die Daten erst bei Bedarf aufbereitet werden.


Data Warehouse

Anders als ein Data Lake speichert ein Data Warehouse Daten in aufbereiteter, strukturierter Form, meist für standardisierte Berichte und Business Intelligence (BI). Es eignet sich für klassische Analysen, während KI-Projekte oft von der Flexibilität eines Data Lakes profitieren (oder beides kombinieren).


Datenschutz

Der Schutz persönlicher Daten und die Einhaltung von Privatsphäre und geltenden Gesetzen (z. B. DSGVO). Im KI-Kontext besonders relevant, da KI oft große Datenmengen benötigt. Ein sorgsamer Umgang mit sensiblen Daten ist deshalb Pflicht – Stichwort Privacy by Design.


Deep Learning (tiefes Lernen)

Ein Teilbereich des Maschinellen Lernens, der künstliche neuronale Netzwerke mit vielen Schichten (Layers) einsetzt. Dadurch können sehr komplexe Muster erkannt und gelernt werden (z. B. Sprachverstehen, Bilderkennung). Deep Learning ist heute die Basis vieler moderner KI-Erfolge.


Deepfake

Täuschend echte, aber gefälschte Medien (Videos, Audios, Bilder), die mithilfe von generativen KI-Systemen erstellt wurden. Deepfakes können Personen Aussagen oder Handlungen zuschreiben, die nie stattgefunden haben, was erhebliche ethische und sicherheitsrelevante Fragen aufwirft.


DSGVO (Datenschutz-Grundverordnung)

Europäische Verordnung, die den Schutz personenbezogener Daten regelt und Unternehmen verpflichtet, den Umgang mit Daten transparent und sicher zu gestalten. KI-Projekte müssen sicherstellen, dass verwendete Daten DSGVO-konform verarbeitet werden.


E

Edge AI

Der Betrieb von KI-Modellen direkt „am Rand“ eines Netzwerks (z. B. auf einem lokalen Gerät oder Sensor), ohne ständig Daten in eine Cloud schicken zu müssen. Das minimiert Latenz und kann die Datenschutz-Situation verbessern, da sensible Daten nicht das Gerät verlassen.


Empfehlungssystem (Recommendation Engine)

Eine KI-Anwendung, die Nutzerdaten auswertet und auf dieser Basis personalisierte Empfehlungen gibt (z. B. Produktvorschläge, Filme, Musik). Oft genutzt von E-Commerce-Plattformen, Streaming-Diensten oder News-Portalen.


Erklärbare KI (XAI) / Explainability

Ansätze, die die Nachvollziehbarkeit von KI-Entscheidungen verbessern. Explainable AI (XAI) möchte u. a. sichtbar machen, welche Eingaben das Modell wie stark beeinflusst haben. Das schafft Vertrauen und ist z. B. in regulierten Bereichen (Finanzen, Medizin) relevant.


F

Federated Learning

Ein verteiltes Lernverfahren, bei dem mehrere Teilnehmer (z. B. verschiedene Standorte oder Organisationen) ein gemeinsames KI-Modell trainieren, ohne dabei ihre lokalen Daten zusammenzuführen. Nur die Modell-Parameter werden ausgetauscht. Das erhöht den Datenschutz, weil die Daten am Ort bleiben.


Feinabstimmung (Fine-Tuning)

Die Anpassung eines bereits vortrainierten Modells auf einen neuen, oft spezifischeren Datensatz. Anstatt ein Modell komplett neu zu trainieren, optimiert man die bestehenden Gewichte (Parameter) gezielt fĂĽr die gewĂĽnschte Anwendung, was Zeit und Ressourcen spart.


G

GAN (Generative Adversarial Network)

Ein generatives KI-Modell, das aus zwei Teilen besteht: einem Generator, der versucht, realistisch wirkende Daten (z. B. Bilder) zu erzeugen, und einem Diskriminator, der echte von künstlichen Daten unterscheiden soll. Durch diesen Wettbewerb verbessern sich beide Netzwerke kontinuierlich.


Generative KI

Ein Bereich der KI, bei dem neue Inhalte (Text, Bilder, Audio, Video) erstellt werden. Bekannte Beispiele sind GPT-Modelle (fĂĽr Texte) oder GANs (fĂĽr Bilder). Generative KI kann Texte verfassen, Bilder zeichnen oder sogar synthetische Stimmen erzeugen.


GPT (Generative Pre-trained Transformer)

Ein von OpenAI entwickelter Modelltyp, der riesige Textmengen vorab gelernt hat, um menschenähnlichen Text zu verstehen und zu erzeugen. GPT-Modelle wie GPT-4 bilden die Basis vieler Chatbots (etwa ChatGPT) oder Entwickler-APIs, welche komplexe Texte, Codes und mehr generieren.


GroĂźes Sprachmodell (LLM)

(Large Language Model) Ein KI-Modell mit sehr vielen Parametern, trainiert auf umfangreichen Textkorpora, das natĂĽrliche Sprache verstehen und generieren kann. Beispiele sind GPT-4, BERT oder PaLM. LLMs sind in der Lage, Fragen zu beantworten, Texte zu ĂĽbersetzen oder zu zusammenzufassen.


H

Halluzination (bei KI)

Wenn ein KI-System (besonders Sprachmodelle) glaubwürdig klingende, aber faktisch falsche oder erfundene Inhalte generiert. Das Modell erfindet „Fakten“, obwohl sie nicht in den Trainingsdaten stehen, und es entsteht der Eindruck, es „fantasiert“.


I

Inference (Inferenz)

Die Phase, in der ein trainiertes KI-Modell auf echte Eingaben angewandt wird, um Vorhersagen oder Ausgaben zu erzeugen. Bei einem Chatbot z. B. ist jeder Antwortvorschlag eine „Inferenz“ des zugrunde liegenden Sprachmodells.


K

KI (KĂĽnstliche Intelligenz)

Ein Sammelbegriff für Computersysteme, die Aufgaben lösen, für die es normalerweise menschlicher Intelligenz bedarf (z. B. Sprache verstehen, Bilder erkennen, Entscheidungen treffen). KI-Systeme basieren häufig auf maschinellem Lernen und/oder regelbasierten Verfahren.


KI-Governance

Richtlinien und Prozesse, die den verantwortungsvollen Einsatz von KI in einer Organisation steuern – inkl. Themen wie Datenschutz, Ethik, Bias-Kontrolle und Compliance. KI-Governance stellt sicher, dass Entscheidungen über KI-Systeme transparent getroffen und überwacht werden.


Konversationelle KI (Conversational AI)

Ein KI-Bereich, der sich auf den Dialog mit Menschen in natürlicher Sprache spezialisiert. Dazu gehören Chatbots, Voicebots und digitale Assistenten wie Alexa oder Siri. Ziel ist es, menschenähnliche Interaktionen zu ermöglichen.


L

LLMOps

Abkürzung für Large Language Model Operations. Darunter versteht man Prozesse und Tools, die speziell für den Lebenszyklus großer Sprachmodelle (LLMs) entwickelt wurden – ähnlich wie MLOps, aber fokussiert auf die Herausforderungen beim Betrieb und Monitoring großer Sprachmodelle (z. B. GPT).


M

Maschinelles Lernen (ML)

Ein Teilgebiet der KI, in dem Algorithmen anhand von Daten Muster „erlernen“ und selbstständig Lösungen generieren, ohne explizit programmiert zu werden. ML umfasst u. a. überwachtes, unüberwachtes und verstärkendes Lernen.


MLOps (Machine Learning Operations)

Eine Sammlung von Methoden und Tools, um den gesamten KI-/ML-Lebenszyklus effizient zu managen: von Datenaufbereitung und Modelltraining ĂĽber Deployment (Bereitstellung) bis hin zum Monitoring und zur Wartung. Ziel sind reproduzierbare, skalierbare und robuste ML-Prozesse.


Modell (KI-Modell)

Das Ergebnis des Trainingsprozesses im Maschinellen Lernen. Ein Modell repräsentiert das gelernte Wissen (in Form von Gewichten, Parametern, Entscheidungsbäumen etc.). Mit dem Modell lassen sich dann neue Eingaben analysieren oder klassifizieren.


Multimodales Modell

Ein KI-Modell, das mit verschiedenen Datentypen umgehen kann, z. B. Text, Bilder und Audio gleichzeitig. Solche Systeme ermöglichen komplexe Anwendungen, etwa das Beschreiben eines Bildes in Textform oder das Verknüpfen von Sprachbefehlen mit visuellen Inhalten.


N

NatĂĽrliche Sprachverarbeitung (NLP)

(Natural Language Processing) Ein KI-Teilgebiet, das Computern ermöglicht, geschriebene oder gesprochene menschliche Sprache zu verstehen und zu verarbeiten. Dazu gehören Technologien wie maschinelle Übersetzung, Textanalyse und Chatbots.


Neuronales Netzwerk

Ein Rechenmodell, inspiriert vom menschlichen Gehirn, bestehend aus vielen künstlichen Neuronen und Schichten. Im Training werden die Verbindungen zwischen den Neuronen so angepasst, dass das Netzwerk Muster erkennt. Deep Learning nutzt viele Schichten (Layer), um besonders komplexe Zusammenhänge zu erfassen.


O

Overfitting

Ein Problem, bei dem ein Modell zu genau auf die Trainingsdaten passt und die allgemeinen Muster nicht verallgemeinert. Folge: Auf unbekannten Daten versagt das Modell, da es eher Auswendiglernen als echtes Verstehen betreibt.


P

Predictive Analytics (vorausschauende Analyse)

Die Nutzung statistischer Methoden und ML, um aus historischen Daten Prognosen ĂĽber zukĂĽnftige Ereignisse zu erstellen. Beispiele: Absatzprognosen, Wartungsbedarf von Maschinen, Kundenabwanderungsrisiko.


Die Eingabe (z. B. Frage, Befehl), die ein generatives Modell erhält, um eine Antwort oder einen Output zu erzeugen. Qualität und Struktur des Prompts beeinflussen maßgeblich, wie hilfreich oder passend die KI-Antwort ausfällt.


Prompt Engineering

Das bewusste Gestalten und Optimieren von Prompts, um von generativen Modellen (z. B. ChatGPT) bessere Ergebnisse zu erhalten. Dazu gehört die Wahl der richtigen Formulierungen, Kontextinformationen und Formatvorgaben.


R

Reinforcement Learning from Human Feedback (RLHF)

Ein spezieller Ansatz des Verstärkenden Lernens, bei dem menschliches Feedback zu KI-Generierungen (z. B. „Antwort A ist besser als B“) in den Trainingsprozess einfließt. So lässt sich die Güte von generativen Sprachmodellen steigern und z. B. unpassende Antworten reduzieren.


RPA (Robotic Process Automation)

Technologie zur Automatisierung repetitiver Büroprozesse, bei denen eine Software die Interaktion mit Benutzeroberflächen nachahmt (z. B. Dateneingabe in Formulare). RPA kann ohne tiefe KI-Methoden auskommen, wird aber zunehmend mit KI kombiniert, um komplexere Aufgaben zu automatisieren (intelligente Automatisierung).


S

Schwache KI (Narrow AI)

KI-Systeme, die auf einen engen Aufgabenbereich spezialisiert sind. Fast alle aktuellen KI-Anwendungen gehören dazu, etwa Bilderkennung, Sprachassistenz oder Chatbots. Starke KI (allgemeine Intelligenz) gibt es derzeit nicht in der Praxis.


Sentimentanalyse

Ein NLP-Verfahren, das ermittelt, ob ein Text (z. B. Tweet, Kundenbewertung) eher positiv, negativ oder neutral gefärbt ist. Unternehmen setzen Sentimentanalyse ein, um die Stimmung ihrer Kunden zu Produkten oder Services zu messen.


Spracherkennung (Speech-to-Text)

Eine KI-gestĂĽtzte Methode, gesprochene Sprache in geschriebenen Text umzuwandeln. Beispiele: Diktierfunktionen in Smartphones, automatische Untertitelung in Videos oder sprachgesteuerte Assistenten.


Sprachsynthese (Text-to-Speech)

Die Erzeugung synthetischer Sprache aus Text durch KI-Algorithmen. Moderne Systeme klingen immer natürlicher und ermöglichen Anwendungsfälle wie Vorlesefunktionen oder das Audiosignal in Navigationsgeräten.


Starke KI (General AI)

Eine bislang hypothetische Form von KI, die ein menschenähnliches Niveau an Verständnis und Lernen in vielen Bereichen aufweist. Diese Form existiert aktuell nicht; fast alle existierenden KI-Systeme sind schwach (spezifisch).


T

Token

In NLP die kleinste Einheit, in die Text zerlegt wird (etwa Worte, Wortteile oder Satzzeichen). Große Sprachmodelle verarbeiten Texte in Tokens. Die Größe und Anzahl der Tokens beeinflusst dabei Aufwand und Kosten (z. B. bei einem API-Aufruf).


Training (von KI-Modellen)

Die Lernphase, in der ein ML-Modell Parameter anpasst, um Muster in Trainingsdaten zu erkennen. Nach erfolgreichem Training kann das Modell in der Inferenzphase auf neue Eingaben reagieren. Training kann ressourcenintensiv sein und erfordert oft groĂźe Datenmengen.


Transformer

Eine neuralnetzbasierte Architektur, die das Attention-Prinzip nutzt, um Beziehungen zwischen Tokens (Wörtern) in einem Text effizient zu verarbeiten. Transformer-Modelle wie GPT oder BERT haben NLP revolutioniert, da sie Kontextinformationen besser erfassen und gleichzeitig umfangreich skalieren können.


Transfer Learning

Ein Vorgehen, bei dem ein vortrainiertes Modell auf eine neue, spezialisierte Aufgabe angepasst wird, ohne ganz von vorn zu beginnen (verwandt mit Feinabstimmung). Das beschleunigt die Entwicklung und erfordert weniger Daten, da das Modell schon „Grundwissen“ besitzt.


U

Ăśberwachtes Lernen (Supervised Learning)

Ein ML-Verfahren, bei dem das Modell mit beschrifteten Daten trainiert wird, also Eingaben samt korrekter Ausgaben (Labels). Ziel ist, diese Zusammenhänge zu verallgemeinern und auch bei neuen Daten richtige Vorhersagen oder Klassifikationen zu liefern.


Underfitting

Gegenteil von Overfitting: Das Modell erkennt nicht genug Muster in den Daten und bleibt zu grob oder ungenau. Sowohl Overfitting als auch Underfitting mindern die ModellgĂĽte und deuten auf unpassende Parameter oder unzureichendes Training hin.


UnĂĽberwachtes Lernen (Unsupervised Learning)

Ein ML-Verfahren, bei dem ein Modell ohne „richtige Antworten“ trainiert wird. Es sucht eigenständig nach Mustern, Ähnlichkeiten oder Strukturen in Daten (z. B. beim Clustering). Das hilft, unbekannte Gruppen oder Strukturen zu entdecken.


V

Verantwortungsvolle KI (Responsible AI)

Ein Ansatz, KI-Systeme so zu entwickeln und einzusetzen, dass sie ethisch, transparent und fair sind. Dazu gehören Maßnahmen gegen Bias, klare Offenlegung von Algorithmen (wo nötig) und Einhaltung gesetzlicher Anforderungen wie Datenschutz.


Verstärkendes Lernen (Reinforcement Learning)

Ein Lernansatz, bei dem ein Agent in einer Umgebung agiert und fĂĽr gute Ergebnisse belohnt, fĂĽr schlechte bestraft wird. So lernt er iterativ die Verhaltensweisen, die zu den besten Belohnungen fĂĽhren. Beispiele sind KI-Systeme fĂĽr Spiele (Go, Schach) oder Robotik.


Voicebot (Sprachbot)

Ein sprachbasierter Chatbot, der auf Spracherkennung und Sprachsynthese setzt. Nutzer interagieren per Stimme anstelle von Text. Voicebots finden sich z. B. in Telefon-Hotlines, Smart Speakern oder Navigationssystemen.

Last updated