bookGlossar/ Grundbegriffe

circle-info

Dieses Glossar behandelt die wichtigsten Begriffe in der Welt der KI

A

A/B-Testing

Ein Verfahren, bei dem zwei Varianten (A und B) miteinander verglichen werden, um datenbasiert zu ermitteln, welche Variante bessere Ergebnisse liefert (z. B. höhere Klickrate oder höhere Genauigkeit bei einem KI-Modell). Im KI-Kontext wird A/B-Testing eingesetzt, um verschiedene Modellversionen mit realen Nutzern zu testen und die leistungsstĂ€rkere Variante zu wĂ€hlen.


AI Act (KI-Verordnung)

Eine Gesetzgebung der EU, die klare, verbindliche Regeln fĂŒr Entwicklung und Einsatz von KI festlegt, basierend auf Risikoklassen (z. B. Hochrisiko-KI in Medizin oder Justiz). Ziel ist es, Transparenz, Sicherheit und Datenschutz bei KI-Anwendungen zu gewĂ€hrleisten. Unternehmen mĂŒssen ihre KI-Systeme entsprechend zertifizieren oder prĂŒfen lassen.


Algorithmus

Eine klar definierte Vorgehensweise, um ein Problem zu lösen oder eine Aufgabe Schritt fĂŒr Schritt abzuarbeiten. Ein Algorithmus ist nicht automatisch lernfĂ€hig; er folgt statisch den programmierten Regeln. Erst wenn Algorithmen sich auf Basis von Daten verbessern können (Maschinelles Lernen), spricht man von „KĂŒnstlicher Intelligenz“.


Automatisierung

Der Prozess, in dem Aufgaben oder AblĂ€ufe mithilfe von Technologie (z. B. KI oder RPA) ohne weiteres menschliches Eingreifen durchgefĂŒhrt werden. So lassen sich wiederkehrende TĂ€tigkeiten schneller, kostengĂŒnstiger und oft fehlerĂ€rmer erledigen.


B

Basismodell (Foundation Model)

Ein großes, vortrainiertes KI-Modell (z. B. ein umfassendes Sprach- oder Bildmodell), das als allgemeine Grundlage fĂŒr viele unterschiedliche Aufgaben dient. Statt jedes Mal von null zu starten, kann man solch ein Modell mit weniger Aufwand auf spezielle Anwendungen feinabstimmen.


Bias (Voreingenommenheit)

Eine systematische Verzerrung in Daten oder Algorithmen, die zu diskriminierenden oder fehlerhaften Ergebnissen fĂŒhrt. Wenn z. B. ein KI-System fĂŒr Bewerbungen mehrheitlich mit Daten von MĂ€nnern trainiert wird, kann es weibliche Kandidatinnen ungewollt benachteiligen. Bias-Management ist daher ein wesentlicher Teil verantwortungsvoller KI-Entwicklung.


Big Data

Sehr große, schnell wachsende und komplexe Datenmengen, die sich mit herkömmlichen Methoden kaum bearbeiten lassen. Big Data bildet oft die Basis fĂŒr KI-Projekte, da umfangreiche Trainingsdaten die Leistung von Modellen verbessern können.


C

Chatbot

Ein Programm, das ĂŒber Text (oder Sprache) mit Menschen interagiert und dabei natĂŒrliche Sprache verarbeitet. Moderne Chatbots basieren hĂ€ufig auf NLP und können rund um die Uhr automatisierte Antworten geben (z. B. im Kundenservice).


Clustering

Ein unĂŒberwachtes Lernverfahren, bei dem Datenobjekte in Gruppen (Cluster) eingeteilt werden, die sich in bestimmten Merkmalen Ă€hneln. Clustering identifiziert Strukturen oder Ähnlichkeiten in Daten, ohne dass man vorher Kategorien definiert (etwa Kunden-Segmente).


Computer Vision (Bildverarbeitung)

Ein Teilgebiet der KI, das Maschinen beibringt, Bilder oder Videos zu analysieren und darin Objekte, Gesichter oder andere Muster zu erkennen. Typische Anwendungen sind Gesichtserkennung, QualitÀtskontrollen in der Industrie oder automatisiertes Auslesen von Dokumenten.


D

Data Lake

Ein zentrales Repository, in dem rohe, unstrukturierte, halbstrukturierte und strukturierte Daten gespeichert werden, ohne sie vorab zu transformieren. Ein Data Lake ermöglicht flexiblere Analysen und KI-Anwendungen, da die Daten erst bei Bedarf aufbereitet werden.


Data Warehouse

Anders als ein Data Lake speichert ein Data Warehouse Daten in aufbereiteter, strukturierter Form, meist fĂŒr standardisierte Berichte und Business Intelligence (BI). Es eignet sich fĂŒr klassische Analysen, wĂ€hrend KI-Projekte oft von der FlexibilitĂ€t eines Data Lakes profitieren (oder beides kombinieren).


Datenschutz

Der Schutz persönlicher Daten und die Einhaltung von PrivatsphĂ€re und geltenden Gesetzen (z. B. DSGVO). Im KI-Kontext besonders relevant, da KI oft große Datenmengen benötigt. Ein sorgsamer Umgang mit sensiblen Daten ist deshalb Pflicht – Stichwort Privacy by Design.


Deep Learning (tiefes Lernen)

Ein Teilbereich des Maschinellen Lernens, der kĂŒnstliche neuronale Netzwerke mit vielen Schichten (Layers) einsetzt. Dadurch können sehr komplexe Muster erkannt und gelernt werden (z. B. Sprachverstehen, Bilderkennung). Deep Learning ist heute die Basis vieler moderner KI-Erfolge.


Deepfake

TÀuschend echte, aber gefÀlschte Medien (Videos, Audios, Bilder), die mithilfe von generativen KI-Systemen erstellt wurden. Deepfakes können Personen Aussagen oder Handlungen zuschreiben, die nie stattgefunden haben, was erhebliche ethische und sicherheitsrelevante Fragen aufwirft.


DSGVO (Datenschutz-Grundverordnung)

EuropĂ€ische Verordnung, die den Schutz personenbezogener Daten regelt und Unternehmen verpflichtet, den Umgang mit Daten transparent und sicher zu gestalten. KI-Projekte mĂŒssen sicherstellen, dass verwendete Daten DSGVO-konform verarbeitet werden.


E

Edge AI

Der Betrieb von KI-Modellen direkt „am Rand“ eines Netzwerks (z. B. auf einem lokalen GerĂ€t oder Sensor), ohne stĂ€ndig Daten in eine Cloud schicken zu mĂŒssen. Das minimiert Latenz und kann die Datenschutz-Situation verbessern, da sensible Daten nicht das GerĂ€t verlassen.


Empfehlungssystem (Recommendation Engine)

Eine KI-Anwendung, die Nutzerdaten auswertet und auf dieser Basis personalisierte Empfehlungen gibt (z. B. ProduktvorschlĂ€ge, Filme, Musik). Oft genutzt von E-Commerce-Plattformen, Streaming-Diensten oder News-Portalen.


ErklÀrbare KI (XAI) / Explainability

AnsĂ€tze, die die Nachvollziehbarkeit von KI-Entscheidungen verbessern. Explainable AI (XAI) möchte u. a. sichtbar machen, welche Eingaben das Modell wie stark beeinflusst haben. Das schafft Vertrauen und ist z. B. in regulierten Bereichen (Finanzen, Medizin) relevant.


F

Federated Learning

Ein verteiltes Lernverfahren, bei dem mehrere Teilnehmer (z. B. verschiedene Standorte oder Organisationen) ein gemeinsames KI-Modell trainieren, ohne dabei ihre lokalen Daten zusammenzufĂŒhren. Nur die Modell-Parameter werden ausgetauscht. Das erhöht den Datenschutz, weil die Daten am Ort bleiben.


Feinabstimmung (Fine-Tuning)

Die Anpassung eines bereits vortrainierten Modells auf einen neuen, oft spezifischeren Datensatz. Anstatt ein Modell komplett neu zu trainieren, optimiert man die bestehenden Gewichte (Parameter) gezielt fĂŒr die gewĂŒnschte Anwendung, was Zeit und Ressourcen spart.


G

GAN (Generative Adversarial Network)

Ein generatives KI-Modell, das aus zwei Teilen besteht: einem Generator, der versucht, realistisch wirkende Daten (z. B. Bilder) zu erzeugen, und einem Diskriminator, der echte von kĂŒnstlichen Daten unterscheiden soll. Durch diesen Wettbewerb verbessern sich beide Netzwerke kontinuierlich.


Generative KI

Ein Bereich der KI, bei dem neue Inhalte (Text, Bilder, Audio, Video) erstellt werden. Bekannte Beispiele sind GPT-Modelle (fĂŒr Texte) oder GANs (fĂŒr Bilder). Generative KI kann Texte verfassen, Bilder zeichnen oder sogar synthetische Stimmen erzeugen.


GPT (Generative Pre-trained Transformer)

Ein von OpenAI entwickelter Modelltyp, der riesige Textmengen vorab gelernt hat, um menschenÀhnlichen Text zu verstehen und zu erzeugen. GPT-Modelle wie GPT-4 bilden die Basis vieler Chatbots (etwa ChatGPT) oder Entwickler-APIs, welche komplexe Texte, Codes und mehr generieren.


Großes Sprachmodell (LLM)

(Large Language Model) Ein KI-Modell mit sehr vielen Parametern, trainiert auf umfangreichen Textkorpora, das natĂŒrliche Sprache verstehen und generieren kann. Beispiele sind GPT-4, BERT oder PaLM. LLMs sind in der Lage, Fragen zu beantworten, Texte zu ĂŒbersetzen oder zu zusammenzufassen.


H

Halluzination (bei KI)

Wenn ein KI-System (besonders Sprachmodelle) glaubwĂŒrdig klingende, aber faktisch falsche oder erfundene Inhalte generiert. Das Modell erfindet „Fakten“, obwohl sie nicht in den Trainingsdaten stehen, und es entsteht der Eindruck, es „fantasiert“.


I

Inference (Inferenz)

Die Phase, in der ein trainiertes KI-Modell auf echte Eingaben angewandt wird, um Vorhersagen oder Ausgaben zu erzeugen. Bei einem Chatbot z. B. ist jeder Antwortvorschlag eine „Inferenz“ des zugrunde liegenden Sprachmodells.


K

KI (KĂŒnstliche Intelligenz)

Ein Sammelbegriff fĂŒr Computersysteme, die Aufgaben lösen, fĂŒr die es normalerweise menschlicher Intelligenz bedarf (z. B. Sprache verstehen, Bilder erkennen, Entscheidungen treffen). KI-Systeme basieren hĂ€ufig auf maschinellem Lernen und/oder regelbasierten Verfahren.


KI-Governance

Richtlinien und Prozesse, die den verantwortungsvollen Einsatz von KI in einer Organisation steuern – inkl. Themen wie Datenschutz, Ethik, Bias-Kontrolle und Compliance. KI-Governance stellt sicher, dass Entscheidungen ĂŒber KI-Systeme transparent getroffen und ĂŒberwacht werden.


Konversationelle KI (Conversational AI)

Ein KI-Bereich, der sich auf den Dialog mit Menschen in natĂŒrlicher Sprache spezialisiert. Dazu gehören Chatbots, Voicebots und digitale Assistenten wie Alexa oder Siri. Ziel ist es, menschenĂ€hnliche Interaktionen zu ermöglichen.


L

LLMOps

AbkĂŒrzung fĂŒr Large Language Model Operations. Darunter versteht man Prozesse und Tools, die speziell fĂŒr den Lebenszyklus großer Sprachmodelle (LLMs) entwickelt wurden – Ă€hnlich wie MLOps, aber fokussiert auf die Herausforderungen beim Betrieb und Monitoring großer Sprachmodelle (z. B. GPT).


M

Maschinelles Lernen (ML)

Ein Teilgebiet der KI, in dem Algorithmen anhand von Daten Muster „erlernen“ und selbststĂ€ndig Lösungen generieren, ohne explizit programmiert zu werden. ML umfasst u. a. ĂŒberwachtes, unĂŒberwachtes und verstĂ€rkendes Lernen.


MLOps (Machine Learning Operations)

Eine Sammlung von Methoden und Tools, um den gesamten KI-/ML-Lebenszyklus effizient zu managen: von Datenaufbereitung und Modelltraining ĂŒber Deployment (Bereitstellung) bis hin zum Monitoring und zur Wartung. Ziel sind reproduzierbare, skalierbare und robuste ML-Prozesse.


Modell (KI-Modell)

Das Ergebnis des Trainingsprozesses im Maschinellen Lernen. Ein Modell reprÀsentiert das gelernte Wissen (in Form von Gewichten, Parametern, EntscheidungsbÀumen etc.). Mit dem Modell lassen sich dann neue Eingaben analysieren oder klassifizieren.


Multimodales Modell

Ein KI-Modell, das mit verschiedenen Datentypen umgehen kann, z. B. Text, Bilder und Audio gleichzeitig. Solche Systeme ermöglichen komplexe Anwendungen, etwa das Beschreiben eines Bildes in Textform oder das VerknĂŒpfen von Sprachbefehlen mit visuellen Inhalten.


N

NatĂŒrliche Sprachverarbeitung (NLP)

(Natural Language Processing) Ein KI-Teilgebiet, das Computern ermöglicht, geschriebene oder gesprochene menschliche Sprache zu verstehen und zu verarbeiten. Dazu gehören Technologien wie maschinelle Übersetzung, Textanalyse und Chatbots.


Neuronales Netzwerk

Ein Rechenmodell, inspiriert vom menschlichen Gehirn, bestehend aus vielen kĂŒnstlichen Neuronen und Schichten. Im Training werden die Verbindungen zwischen den Neuronen so angepasst, dass das Netzwerk Muster erkennt. Deep Learning nutzt viele Schichten (Layer), um besonders komplexe ZusammenhĂ€nge zu erfassen.


O

Overfitting

Ein Problem, bei dem ein Modell zu genau auf die Trainingsdaten passt und die allgemeinen Muster nicht verallgemeinert. Folge: Auf unbekannten Daten versagt das Modell, da es eher Auswendiglernen als echtes Verstehen betreibt.


P

Predictive Analytics (vorausschauende Analyse)

Die Nutzung statistischer Methoden und ML, um aus historischen Daten Prognosen ĂŒber zukĂŒnftige Ereignisse zu erstellen. Beispiele: Absatzprognosen, Wartungsbedarf von Maschinen, Kundenabwanderungsrisiko.


Die Eingabe (z. B. Frage, Befehl), die ein generatives Modell erhĂ€lt, um eine Antwort oder einen Output zu erzeugen. QualitĂ€t und Struktur des Prompts beeinflussen maßgeblich, wie hilfreich oder passend die KI-Antwort ausfĂ€llt.


Prompt Engineering

Das bewusste Gestalten und Optimieren von Prompts, um von generativen Modellen (z. B. ChatGPT) bessere Ergebnisse zu erhalten. Dazu gehört die Wahl der richtigen Formulierungen, Kontextinformationen und Formatvorgaben.


R

Reinforcement Learning from Human Feedback (RLHF)

Ein spezieller Ansatz des VerstĂ€rkenden Lernens, bei dem menschliches Feedback zu KI-Generierungen (z. B. „Antwort A ist besser als B“) in den Trainingsprozess einfließt. So lĂ€sst sich die GĂŒte von generativen Sprachmodellen steigern und z. B. unpassende Antworten reduzieren.


RPA (Robotic Process Automation)

Technologie zur Automatisierung repetitiver BĂŒroprozesse, bei denen eine Software die Interaktion mit BenutzeroberflĂ€chen nachahmt (z. B. Dateneingabe in Formulare). RPA kann ohne tiefe KI-Methoden auskommen, wird aber zunehmend mit KI kombiniert, um komplexere Aufgaben zu automatisieren (intelligente Automatisierung).


S

Schwache KI (Narrow AI)

KI-Systeme, die auf einen engen Aufgabenbereich spezialisiert sind. Fast alle aktuellen KI-Anwendungen gehören dazu, etwa Bilderkennung, Sprachassistenz oder Chatbots. Starke KI (allgemeine Intelligenz) gibt es derzeit nicht in der Praxis.


Sentimentanalyse

Ein NLP-Verfahren, das ermittelt, ob ein Text (z. B. Tweet, Kundenbewertung) eher positiv, negativ oder neutral gefĂ€rbt ist. Unternehmen setzen Sentimentanalyse ein, um die Stimmung ihrer Kunden zu Produkten oder Services zu messen.


Spracherkennung (Speech-to-Text)

Eine KI-gestĂŒtzte Methode, gesprochene Sprache in geschriebenen Text umzuwandeln. Beispiele: Diktierfunktionen in Smartphones, automatische Untertitelung in Videos oder sprachgesteuerte Assistenten.


Sprachsynthese (Text-to-Speech)

Die Erzeugung synthetischer Sprache aus Text durch KI-Algorithmen. Moderne Systeme klingen immer natĂŒrlicher und ermöglichen AnwendungsfĂ€lle wie Vorlesefunktionen oder das Audiosignal in NavigationsgerĂ€ten.


Starke KI (General AI)

Eine bislang hypothetische Form von KI, die ein menschenÀhnliches Niveau an VerstÀndnis und Lernen in vielen Bereichen aufweist. Diese Form existiert aktuell nicht; fast alle existierenden KI-Systeme sind schwach (spezifisch).


T

Token

In NLP die kleinste Einheit, in die Text zerlegt wird (etwa Worte, Wortteile oder Satzzeichen). Große Sprachmodelle verarbeiten Texte in Tokens. Die GrĂ¶ĂŸe und Anzahl der Tokens beeinflusst dabei Aufwand und Kosten (z. B. bei einem API-Aufruf).


Training (von KI-Modellen)

Die Lernphase, in der ein ML-Modell Parameter anpasst, um Muster in Trainingsdaten zu erkennen. Nach erfolgreichem Training kann das Modell in der Inferenzphase auf neue Eingaben reagieren. Training kann ressourcenintensiv sein und erfordert oft große Datenmengen.


Transformer

Eine neuralnetzbasierte Architektur, die das Attention-Prinzip nutzt, um Beziehungen zwischen Tokens (Wörtern) in einem Text effizient zu verarbeiten. Transformer-Modelle wie GPT oder BERT haben NLP revolutioniert, da sie Kontextinformationen besser erfassen und gleichzeitig umfangreich skalieren können.


Transfer Learning

Ein Vorgehen, bei dem ein vortrainiertes Modell auf eine neue, spezialisierte Aufgabe angepasst wird, ohne ganz von vorn zu beginnen (verwandt mit Feinabstimmung). Das beschleunigt die Entwicklung und erfordert weniger Daten, da das Modell schon „Grundwissen“ besitzt.


U

Überwachtes Lernen (Supervised Learning)

Ein ML-Verfahren, bei dem das Modell mit beschrifteten Daten trainiert wird, also Eingaben samt korrekter Ausgaben (Labels). Ziel ist, diese ZusammenhÀnge zu verallgemeinern und auch bei neuen Daten richtige Vorhersagen oder Klassifikationen zu liefern.


Underfitting

Gegenteil von Overfitting: Das Modell erkennt nicht genug Muster in den Daten und bleibt zu grob oder ungenau. Sowohl Overfitting als auch Underfitting mindern die ModellgĂŒte und deuten auf unpassende Parameter oder unzureichendes Training hin.


UnĂŒberwachtes Lernen (Unsupervised Learning)

Ein ML-Verfahren, bei dem ein Modell ohne „richtige Antworten“ trainiert wird. Es sucht eigenstĂ€ndig nach Mustern, Ähnlichkeiten oder Strukturen in Daten (z. B. beim Clustering). Das hilft, unbekannte Gruppen oder Strukturen zu entdecken.


V

Verantwortungsvolle KI (Responsible AI)

Ein Ansatz, KI-Systeme so zu entwickeln und einzusetzen, dass sie ethisch, transparent und fair sind. Dazu gehören Maßnahmen gegen Bias, klare Offenlegung von Algorithmen (wo nötig) und Einhaltung gesetzlicher Anforderungen wie Datenschutz.


VerstÀrkendes Lernen (Reinforcement Learning)

Ein Lernansatz, bei dem ein Agent in einer Umgebung agiert und fĂŒr gute Ergebnisse belohnt, fĂŒr schlechte bestraft wird. So lernt er iterativ die Verhaltensweisen, die zu den besten Belohnungen fĂŒhren. Beispiele sind KI-Systeme fĂŒr Spiele (Go, Schach) oder Robotik.


Voicebot (Sprachbot)

Ein sprachbasierter Chatbot, der auf Spracherkennung und Sprachsynthese setzt. Nutzer interagieren per Stimme anstelle von Text. Voicebots finden sich z. B. in Telefon-Hotlines, Smart Speakern oder Navigationssystemen.

Last updated