{"id":33397,"date":"2021-12-09T16:59:14","date_gmt":"2021-12-09T15:59:14","guid":{"rendered":"https:\/\/www.inovex.de\/?p=33397"},"modified":"2022-11-17T10:29:08","modified_gmt":"2022-11-17T09:29:08","slug":"social-bias-ki-modelle","status":"publish","type":"post","link":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/","title":{"rendered":"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht"},"content":{"rendered":"<p>Dieser Artikel zeigt auf, wie sich Bias in Natural Language Generation (NLG) durch gro\u00dfe Sprachmodelle wie GPT-2 und GPT-3 nachweisen l\u00e4sst und ob bzw. wie man Bias in vortrainierten Modellen abschw\u00e4chen kann.<!--more--><\/p>\n<p>Gro\u00dfe Sprachmodelle wie GPT-2 oder GPT-3 sind im Trend, denn sie k\u00f6nnen flie\u00dfende Texte generieren, die wie vom Menschen verfasst wirken. Gro\u00df sind diese Modelle da sie viele Parameter haben und auf Basis vieler Daten trainiert werden. Bei Modellen wie GPT-2 oder GPT-3 sprechen wir \u00fcber 774 Millionen, respektive 175 Milliarden Modellparameter und 40 GB bzw. 45 TB aus dem Internet gescrapter Textdaten. F\u00fcr das Training von GPT-2 wurden diese Daten von Reddit und darin verlinkten Webseiten gesammelt. Die Reddit-Nutzerschaft besteht jedoch vor allen Dingen aus wei\u00dfen M\u00e4nnern zwischen 18 und 29, sodass man von einem Sampling Bias sprechen kann: die Interessen und Ansichten, die auf Reddit kommuniziert werden, repr\u00e4sentieren nicht die Gesamtgesellschaft, sondern nur eine ausgew\u00e4hlte Gruppe. \u00c4hnliches kann man auch bei Datenbasen anderer KI-Modelle beobachten (siehe z. B. <a href=\"https:\/\/aclanthology.org\/2021.emnlp-main.98\/\">Dodge et al., 2021<\/a>, <a href=\"https:\/\/arxiv.org\/pdf\/2110.01963.pdf\">Birhane et al., 2021<\/a>). Ihre Inhalte umfassen auch ungewollte rassistische, sexistische oder homophobe Vorurteile, die den gro\u00dfen KI-Modellen nicht entgehen. In der Folge kann gezeigt werden, dass sie nachweislich beispielsweise rassistische, homophobe (<a href=\"https:\/\/aclanthology.org\/2020.findings-emnlp.291.pdf\">Sheng et al., 2020<\/a>) oder religi\u00f6se Stereotype (<a href=\"https:\/\/www.nature.com\/articles\/s42256-021-00359-2?proof=t\">Abid et al., 2021<\/a>) aufgreifen und reproduzieren. Die Ergebnisse meiner Masterarbeit zeigen u. a., dass GPT-2 (in deutscher Variante) und GPT-3 Frauen wesentlich h\u00e4ufiger sexualisieren oder in einem h\u00e4uslichen F\u00fcrsorge-Kontext darstellen als M\u00e4nner.<\/p>\n<p>In diesem Blogpost m\u00f6chte ich anhand des Vorgehens und der Ergebnisse meiner Masterarbeit folgende Dinge zeigen:<\/p>\n<ol>\n<li>Wie sich Bias in Natural Language Generation (NLG) nachweisen l\u00e4sst<\/li>\n<li>Ob und wie man Bias mitigieren, also in vortrainierten Modellen abschw\u00e4chen kann<\/li>\n<\/ol>\n<p>Der Einsatz von KI etabliert sich in unserer Gesellschaft zunehmend. Damit vermehren sich auch die Interaktionsschnittstellen zwischen KI und Mensch. Umso dringender m\u00fcssen sich Entwickler:innen und Forscher:innen ihrer sozialen Verantwortung stellen \u2013 soziale Vorurteile sind nur eins von vielen Themen, die hierzu in den Fokus r\u00fccken m\u00fcssen. Vorab m\u00f6chte ich schon darauf hinweisen, dass die Ursache f\u00fcr diese Vorurteile vor allen Dingen in den Daten liegt, die den KI-Modellen zugrunde liegen. Die eigentliche L\u00f6sung w\u00e4ren sorgf\u00e4ltiger kuratierte Daten. Aufgrund des enormen zeitlichen und finanziellen Aufwands ist dies jedoch kaum vereinbar mit dem Trend hin zu immer gr\u00f6\u00dfer werdenden Modellen mit h\u00f6herem Datenbedarf (siehe <a href=\"https:\/\/dl.acm.org\/doi\/10.1145\/3442188.3445922\">Bender et al., 2021<\/a>). Hier muss es langfristig ein Umdenken geben. Kleinere und effizientere Modelle sind auch aus \u00f6kologischen Gr\u00fcnden ein hoffnungsvoller Forschungszweig (siehe z. B. <a href=\"https:\/\/huggingface.co\/blog\/large-language-models\">https:\/\/huggingface.co\/blog\/large-language-models<\/a>).<\/p>\n<h2>Bias Quantifizieren<\/h2>\n<p>Die Forschung zu Fairness und Bias in der englischen Textgenerierung hat bereits einige Methoden hervorgebracht, um soziale Vorurteile (Social Bias) quantifizierbar zu machen. Dies l\u00e4sst sich beispielsweise durch \u201eValenz-basierte\u201c Classifier erreichen. Damit meine ich z. B. Sentiment Classifier, welche die Stimmung in einem Satz erkennen, oder Classifier f\u00fcr Toxizit\u00e4t. In meiner Masterarbeit habe ich ein neueres Konzept namens Regard untersucht (<a href=\"https:\/\/aclanthology.org\/D19-1339.pdf\">Sheng et al., 2019<\/a>).<\/p>\n<h3>Das Konzept <em>Regard<\/em><\/h3>\n<p>Mit Regard ist die \u201eAchtung\u201c vor einer Person gemeint, die durch eine Beschreibung dieser Person vermittelt wird. \u201eDie Person war bekannt daf\u00fcr, dass sie mit ihren B\u00fcchern anderen Menschen die Augen \u00f6ffnete\u201c ist ein Beispiel f\u00fcr einen Satz mit positivem Regard, da wir auf Basis dieser Beschreibung eher positiv \u00fcber die Person denken. \u201eDie Person arbeitete als Verk\u00e4uferin.\u201c vermittelt ein neutrales Bild \u00fcber die Person (neutraler Regard). Der Satz \u201eDie Person wurde betrachtet als w\u00e4re sie ein St\u00fcck M\u00fcll.\u201c hat zur Folge, dass wir negativ \u00fcber die Person denken (negativer Regard).<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-33404 size-full\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/1_Sprechblasen-e1638896366321.png\" alt=\"Drei Sprechblasen mit positiven, negativen und neutralen Aussagen \u00fcber eine Person. \" width=\"705\" height=\"395\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/1_Sprechblasen-e1638896366321.png 705w, https:\/\/www.inovex.de\/wp-content\/uploads\/1_Sprechblasen-e1638896366321-300x168.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/1_Sprechblasen-e1638896366321-400x224.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/1_Sprechblasen-e1638896366321-360x202.png 360w\" sizes=\"auto, (max-width: 705px) 100vw, 705px\" \/><\/p>\n<div class=\"mceTemp\"><\/div>\n<h3>Datensammlung und Entwicklung eines Regard Classifiers<\/h3>\n<p>F\u00fcr das Training des Classifiers habe ich einen eigenen Datensatz \u00fcber eine webbasierte Umfrage erhoben. Dem oben beschriebenen Regard-Konzept folgend, sollten die Teilnehmenden Personenbeschreibungen erfinden, die eine Person in ein negatives, neutrales oder positives Licht stellen. Jede Beschreibung beginnt mit den Worten \u201eDie Person\u201c und umfasst einen Satz. Auf diese Weise wurden ca. 1.000 individuelle deutsche S\u00e4tze gesammelt.<\/p>\n<p>F\u00fcnf unabh\u00e4ngige Annotator:innen wurden dann darum gebeten, alle S\u00e4tze nochmals danach zu beurteilen, ob sie die Person negativ, neutral oder positiv dastehen lassen. Die originale Zuweisung wurde nat\u00fcrlich geheim gehalten. Ein Mehrheitsvotum der f\u00fcnf unterschiedlichen Ratings wurde dann als Goldstandard genutzt. Mithilfe dieser Daten wurde ein Regard Classifier trainiert. Hierzu habe ich mit unterschiedlichen Embeddings (FastText und SentenceBERT) und Classifier-Ans\u00e4tzen (Gradient Boosted Trees, Gated Recurrent Units und Transformer) experimentiert.<\/p>\n<p>Das beste und finale Modell basiert auf einer multilingualen Version von SentenceBERT. Das ist ein Transformer-basierter Sprach-Enkodierer, der sich besonders f\u00fcr die Repr\u00e4sentation von S\u00e4tzen eignet. BERT-basierte vortrainierte Sprachmodelle bringen sehr viel kontextuelles Vorwissen mit, sodass Begriffe wie z. B. \u201eMenschenrechte\u201c bereits eine positive Konnotation mit sich bringen. Der Classifier kann den Regard auf den Testdaten mit einer Wahrscheinlichkeit von 78 % vorhersagen, was vergleichbar mit dem englischen Original ist.<\/p>\n<h3>Messung von Regard<\/h3>\n<p>Der Regard Classifier wurde eingesetzt, um gro\u00dfe Mengen generierter Beschreibungen \u00fcber z. B. M\u00e4nner und Frauen zu klassifizieren. Der Vergleich der Proportionen von positiven, neutralen und negativen Beschreibungen pro Geschlecht ist schlie\u00dflich ein direkter Indikator daf\u00fcr, ob das generierende Sprachmodell einen Bias hat. Werden zum Beispiel mehr positive Beschreibungen \u00fcber M\u00e4nner verfasst als \u00fcber Frauen, k\u00f6nnen wir folgern, dass das Modell einen Bias zugunsten von M\u00e4nnern reproduziert. In anderen Worten ausgedr\u00fcckt, hie\u00dfe es, dass das Modell im Anwendungskontext m\u00e4nnliche Subjekte in ein besseres Licht r\u00fcckt.<\/p>\n<p>Ich habe mit <a href=\"https:\/\/github.com\/bminixhofer\/gerpt2\">GerPT-2<\/a> ca. 1.000 und mit GPT-3 ca. 200 S\u00e4tze pro Geschlecht generiert (denn die Nutzung von GPT-3 ist kostenpflichtig), um deren Regard zu klassifizieren. F\u00fcr die Generierung muss man den Modellen Satzanf\u00e4nge als Eingabe geben \u2013 sogenannte Prompts. Diese bestanden in meiner Arbeit immer aus einer demografischen Nennung (\u201eDie Frau\u201c oder \u201eDer Mann\u201c) sowie einem der Bias-Kontexte aus der folgenden Tabelle. Es gab also zehn unterschiedliche Prompts pro Geschlecht. Auch hier orientierte sich das Vorgehen an <a href=\"https:\/\/aclanthology.org\/D19-1339.pdf\">Sheng et al. (2019)<\/a>.<\/p>\n<figure id=\"attachment_33406\" aria-describedby=\"caption-attachment-33406\" style=\"width: 640px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33406 size-large\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-1024x427.png\" alt=\"Satzteile vom Deutschen ins Englische \u00fcbersetzt und eingeordnet in ihren Bias Kontext\" width=\"640\" height=\"267\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-1024x427.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-300x125.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-768x320.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-1536x640.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-2048x853.png 2048w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-1920x800.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-400x167.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/2_table-360x150.png 360w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><figcaption id=\"caption-attachment-33406\" class=\"wp-caption-text\">Bias Contexts angelegt an <a href=\"https:\/\/aclanthology.org\/D19-1339.pdf\"><span style=\"font-weight: 400;\">Sheng et al. (2019) <\/span><\/a>und ins Deutsche \u00fcbersetzt.<\/figcaption><\/figure>\n<p>Wie die Ergebnisse hier in den Balkendiagrammen zeigen, hat GerPT-2 mehr positive \u00c4u\u00dferungen \u00fcber Frauen generiert und weniger positive \u00fcber M\u00e4nner. F\u00fcr GPT-3 wurden keine signifikanten Gruppenunterschiede gefunden.<\/p>\n<figure id=\"attachment_33408\" aria-describedby=\"caption-attachment-33408\" style=\"width: 470px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33408\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-1024x537.png\" alt=\"Drei Balkendiagramme mit der Verteilung des Regard Scores pro Geschlecht\" width=\"470\" height=\"247\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-1024x537.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-300x157.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-768x403.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-1536x805.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-1920x1007.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-400x210.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793-360x189.png 360w, https:\/\/www.inovex.de\/wp-content\/uploads\/3_regard_no_trigger-e1638896860793.png 1947w\" sizes=\"auto, (max-width: 470px) 100vw, 470px\" \/><figcaption id=\"caption-attachment-33408\" class=\"wp-caption-text\">Verteilung der Regard Scores pro Geschlecht f\u00fcr GerPT-2. (F = \u201cDie Frau\u201c, M = \u201cDer Mann\u201c)<\/figcaption><\/figure>\n<h3>Negativer versus positiver Sexismus<\/h3>\n<p>Um ein besseres Bild von den generierten Texten und assoziierten Labels zu bekommen, habe ich die Daten zus\u00e4tzlich qualitativ analysiert. Ich habe drei Facetten von Gender Bias identifiziert:<\/p>\n<ul>\n<li><em>Sexualization Bias<\/em>: Frauen \u00f6fter sexualisiert oder mit Prostitution in Verbindung gebracht<\/li>\n<li><em>Caregiver Bias<\/em>: Frauen \u00f6fter als Hausfrauen und M\u00fctter dargestellt<\/li>\n<li><em>Perpetrator Bias<\/em>: M\u00e4nner \u00f6fter als T\u00e4ter und Kriminelle dargestellt<\/li>\n<\/ul>\n<p>Diese Facetten korrespondieren mit der <a href=\"https:\/\/www.cambridge.org\/core\/books\/abs\/cambridge-handbook-of-the-psychology-of-prejudice\/ambivalent-sexism-in-the-twentyfirst-century\/FB6613B8604FAB7064AC2F3AF6567C72\">Theorie des Ambivalenten Sexismus<\/a>, die zwischen positivem und negativem Sexismus unterscheidet. Letzterer entspricht der intuitiven Definition von Sexismus als Abwertung und Objektifizierung von Frauen. Der positive Sexismus hingegen \u00e4u\u00dfert sich darin, dass Frauen oftmals als per se einf\u00fchlsam, f\u00fcrsorglich und h\u00e4uslich beschrieben werden. Subjektiv gesehen sind solche Attribute weitestgehend positiv gemeint. Indem sie aber in vornehmlich sozialer oder gar m\u00fctterlicher Rolle dargestellt werden, werden Frauen auch implizit als dem Mann untergeordnet und materiell von ihm abh\u00e4ngig charakterisiert. W\u00e4hrend der beobachtete Sexualization Bias eher mit dem negativen Sexismus korrespondiert, korrespondiert der Caregiver Bias mit positivem Sexismus.<\/p>\n<p>Um meine Beobachtungen mit Zahlen zu untermauern, habe ich ein Keyword-Matching durchgef\u00fchrt. Dazu habe ich die Daten gesichtet, Begriffe ausgew\u00e4hlt, die f\u00fcr die entsprechenden Facetten bezeichnend sind (z. B. \u201eTerrorist\u201c f\u00fcr Perpetrator-Inhalte) und pro Facette ein Lexikon erstellt. Die folgenden Diagramme zeigen, dass beide Modelle diese Biases aufweisen.<\/p>\n<figure id=\"attachment_33420\" aria-describedby=\"caption-attachment-33420\" style=\"width: 640px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33420 size-large\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1024x375.png\" alt=\"Zwei Balkendiagramme zu der relativen Anzahl der Keyword-Matches pro Geschlecht in den Sprachmodellen GerPT-2 und GPT-3. \" width=\"640\" height=\"234\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1024x375.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-300x110.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-768x281.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1536x562.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-2048x749.png 2048w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1920x703.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-400x146.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-360x132.png 360w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><figcaption id=\"caption-attachment-33420\" class=\"wp-caption-text\">Relative Anzahl der Keyword-Matches pro Geschlecht f\u00fcr GerPT-2 und GPT-3. (F = \u201cDie Frau\u201c, M = \u201cDer Mann\u201c)<\/figcaption><\/figure>\n<h3>Assoziation von geschlechtsstereotypischen Berufen<\/h3>\n<p>Zus\u00e4tzlich habe ich auch die am h\u00e4ufigsten genannten Berufe pro Geschlecht gez\u00e4hlt und geplottet, um das Vorhandensein von Berufsstereotypen zu pr\u00fcfen. Wie die folgenden Plots zeigen, sieht GerPT-2 Frauen und M\u00e4nner in unterschiedlichen Berufsarten: Frauen haben eher zuarbeitende und Pflege- oder F\u00fcrsorge-assoziierte Berufe. M\u00e4nner dagegen werden in handwerklichen Berufen verortet. Dass Krankenschwester und Arzt auf einer Ebene sind, ist ein bezeichnender Zufall.<\/p>\n<figure id=\"attachment_33412\" aria-describedby=\"caption-attachment-33412\" style=\"width: 640px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33412 size-large\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-1024x595.png\" alt=\"Zwei Balkendiagramme zu der Relativen Anzahl der Top-10 Berufsbezeichnung in den von GerPT-2 generierten Texten pro Geschlecht.\" width=\"640\" height=\"372\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-1024x595.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-300x174.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-768x446.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-1536x893.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-2048x1191.png 2048w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-1920x1116.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-400x233.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/5_occ_frequencies-e1638897138387-360x209.png 360w\" sizes=\"auto, (max-width: 640px) 100vw, 640px\" \/><figcaption id=\"caption-attachment-33412\" class=\"wp-caption-text\">Relative Anzahl der Top-10 Berufsbezeichnung in den von GerPT-2 generierten Texten pro Geschlecht.<\/figcaption><\/figure>\n<h2>Bias Mitigieren<\/h2>\n<p>Es wird aktuell an verschiedenen Ans\u00e4tzen geforscht, um das Auftreten von Social Bias zu vermindern. In meiner Masterarbeit habe ich mit einem Verfahren experimentiert, das man auf trainierte Modelle zur Textgenerierung anwenden kann. Die sogenannten <em>Bias Mitigation Trigger<\/em> (<a href=\"https:\/\/aclanthology.org\/2020.findings-emnlp.291.pdf\">Sheng et al., 2020<\/a>) basieren auf dem <em>Adversarial Trigger<\/em>-Verfahren (<a href=\"https:\/\/aclanthology.org\/D19-1221\/\">Wallace et al., 2019<\/a>; aus der Welt der <em>Adversarial Attacks<\/em>). Ein Trigger besteht aus einer Reihe von Token; im Falle von GPT-2 sind diese Token Subw\u00f6rter. Der Trigger ergibt sich aus einer Gradienten-basierten Suche auf den Modellgewichten, sodass er am Ende ein vordefiniertes Ziel erf\u00fcllt. In dieser Arbeit wird ein Trigger gesucht, der dazu f\u00fchrt, dass mehr Texte mit positivem Regard generiert werden und weniger Texte mit negativem. Hierzu wird er einem Prompt vorangestellt und manipuliert dann die Richtung der generierten Ausgabe:<\/p>\n<p><img loading=\"lazy\" decoding=\"async\" class=\"aligncenter wp-image-33414\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-1024x187.png\" alt=\"Textboxen mit Satzteilen\" width=\"747\" height=\"136\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-1024x187.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-300x55.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-768x140.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-1536x280.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-2048x373.png 2048w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-1920x350.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-400x73.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/6_trigger_application_schema-360x66.png 360w\" sizes=\"auto, (max-width: 747px) 100vw, 747px\" \/><\/p>\n<p>Gefundene Trigger k\u00f6nnen unabh\u00e4ngig vom Eingabetext wiederverwendet werden und lassen sich zum Teil auch auf andere Modelle \u00fcbertragen. In meiner Arbeit habe ich zum Beispiel die \u00dcbertragbarkeit von GPT-2 auf das wesentlich h\u00f6her parametrisierte GPT-3 untersucht. Der von mir gefundene Trigger lautet: \u201eAschenkeller KemptenGuten Kaufmann Vielf\u00e4ltigkeit\u201c.<\/p>\n<h3>Effekte des Triggers auf Regard<\/h3>\n<p>Das nachfolgende Diagramm zeigt, dass der zuvor signifikante Gruppenunterschied unter Einsatz des Triggers verschwindet und positiver Regard generell h\u00e4ufiger vorkommt.<\/p>\n<figure id=\"attachment_33416\" aria-describedby=\"caption-attachment-33416\" style=\"width: 449px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33416\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-1024x525.png\" alt=\"Drei Balkendiagramme zur Verteilung der Regard Scores pro Geschlecht nach Einsatz des Bias Mitigation Triggers f\u00fcr GerPT-2\" width=\"449\" height=\"230\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-1024x525.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-300x154.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-768x394.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-1536x787.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-1920x984.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-400x205.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949-360x184.png 360w, https:\/\/www.inovex.de\/wp-content\/uploads\/7_regard_tigger_effects-e1638897332949.png 2020w\" sizes=\"auto, (max-width: 449px) 100vw, 449px\" \/><figcaption id=\"caption-attachment-33416\" class=\"wp-caption-text\">Verteilung der Regard Scores pro Geschlecht nach Einsatz des Bias Mitigation Triggers f\u00fcr GerPT-2. (F = \u201cDie Frau\u201c, M = \u201cDer Mann\u201c)<\/figcaption><\/figure>\n<p>Bei GPT-3 hat sich der positive Regard ebenfalls f\u00fcr beide Geschlechter erh\u00f6ht. Die Diagramme unten zeigen die Resultate f\u00fcr GPT-3 ohne und mit Trigger. Auch wenn es von vornherein keinen signifikanten Gruppenunterschied zu mitigieren gab, kann man ablesen, dass der Trigger seinen intendierten Effekt auf GPT-3 hat: negativer Regard wird unwahrscheinlicher und positiver wahrscheinlicher.<\/p>\n<figure id=\"attachment_33418\" aria-describedby=\"caption-attachment-33418\" style=\"width: 801px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33418\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-1024x338.png\" alt=\"Balkendiagramme zur Verteilung der Regard Scores pro Geschlecht mit und Bias Mitigation Triggers f\u00fcr GPT-3\" width=\"801\" height=\"265\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-1024x338.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-300x99.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-768x253.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-1536x506.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-2048x675.png 2048w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-1920x633.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-400x132.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/8_GPT-3_regard_effects-e1638897384967-360x119.png 360w\" sizes=\"auto, (max-width: 801px) 100vw, 801px\" \/><figcaption id=\"caption-attachment-33418\" class=\"wp-caption-text\">Verteilung der Regard Scores pro Geschlecht mit und Bias Mitigation Triggers f\u00fcr GPT-3. (F = \u201cDie Frau\u201c, M = \u201cDer Mann\u201c)<\/figcaption><\/figure>\n<h3>Negativer Sexismus verschwindet aber positiver bleibt<\/h3>\n<p>Ein erneutes Keyword-Matching zeigt, dass der negativ konnotierte Sexismus verschwindet, aber der positive Caregiver Bias bleibt. Das ist keine \u00dcberraschung, da der Mitigierungsansatz ja nur via Regard-Valenz definiert ist. Die Ergebnisse hier zeigen, dass eine so eindimensionale Betrachtung im Zweifel dazu f\u00fchren kann, dass bestimmte Biases \u00fcberdeckt werden. W\u00e4re die Theorie-geleitete qualitative Analyse ausgeblieben, w\u00e4re das Fazit gewesen, dass Bias in GerPT-2 zugunsten der Frauen ausf\u00e4llt. Eine wichtige Lehre der Masterarbeit ist also, dass der Umgang mit sozialen Vorurteilen in KI-Modellen \u2013 sei es die Messung oder der Versuch einer Mitigierung \u2013 immer sozialwissenschaftlich fundiert und multidimensional sein sollte.<\/p>\n<figure id=\"attachment_33420\" aria-describedby=\"caption-attachment-33420\" style=\"width: 632px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33420\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1024x375.png\" alt=\"Balkendiagramme zum negativen und positiven Sexismus pro Geschlecht nach Einsatz der Bias Mitigation Trigger.\" width=\"632\" height=\"231\" srcset=\"https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1024x375.png 1024w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-300x110.png 300w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-768x281.png 768w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1536x562.png 1536w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-2048x749.png 2048w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-1920x703.png 1920w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-400x146.png 400w, https:\/\/www.inovex.de\/wp-content\/uploads\/9_sexism_trigger_effects-e1638897051147-360x132.png 360w\" sizes=\"auto, (max-width: 632px) 100vw, 632px\" \/><figcaption id=\"caption-attachment-33420\" class=\"wp-caption-text\">Negativer und positiver Sexismus pro Geschlecht nach Einsatz der Bias Mitigation Trigger. (F = \u201cDie Frau\u201c, M = \u201cDer Mann\u201c)<\/figcaption><\/figure>\n<h3>Problematischer Content Shift<\/h3>\n<p>Eine weiterer Zufallsbefund zeigt, dass die Nutzung der Trigger eine unerw\u00fcnschte thematische Einf\u00e4rbung zur Folge hat. Der oben genannte Trigger beinhaltet das Wort \u201eKaufmann\u201c. Wie der folgende Plot zeigt, werden die Inhalte in diese Richtung verschoben, sodass pl\u00f6tzlich eine Vielzahl der Personenbeschreibungen kaufm\u00e4nnische Berufsbezeichnungen einschlie\u00dfen. Die berufsbezogenen Geschlechtsstereotypen sind noch erkennbar.<\/p>\n<figure id=\"attachment_33426\" aria-describedby=\"caption-attachment-33426\" style=\"width: 637px\" class=\"wp-caption aligncenter\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-33426\" src=\"https:\/\/www.inovex.de\/wp-content\/uploads\/10_sexism_occ_frequencies_w_trigger-1024x623.png\" alt=\"Zwei Balkendiagramme zur relativen Anzahl der Top-10 Berufsbezeichnung in den von GerPT-2 generierten Texten pro Geschlecht unter Verwendung des Bias Mitigation Triggers\" width=\"637\" height=\"387\" \/><figcaption id=\"caption-attachment-33426\" class=\"wp-caption-text\">Relative Anzahl der Top-10 Berufsbezeichnung in den von GerPT-2 generierten Texten pro Geschlecht unter Verwendung des Bias Mitigation Triggers.<\/figcaption><\/figure>\n<h2>Fazit<\/h2>\n<p>Gro\u00dfe KI-Modelle, die f\u00fcr die Generierung von Text eingesetzt werden, modellieren und reproduzieren Geschlechtervorurteile. Die Analysen haben gezeigt, dass diese sowohl mit negativem als auch positivem Sexismus korrespondieren. Ein aussagekr\u00e4ftiges Bias-Ma\u00df muss mehrdimensional sein, um unterschiedliche Facetten von zum Beispiel Sexismus erkennbar zu machen. Forscher:innen und Entwickler:innen aus technologischen F\u00e4chern, die sich mit diesem Thema besch\u00e4ftigen, sollten die Auseinandersetzung mit sozialwissenschaftlichen Konzepten nicht scheuen. Sie erm\u00f6glicht, sozial relevantere und auch aussagekr\u00e4ftigere Analysen zu erzielen.<\/p>\n<p>Die Mitigierung von Bias ist vom zugrunde liegenden Ma\u00df und dem theoretischen Konzept abh\u00e4ngig. Das Regard-basierte Verfahren hat zwar negativen Regard reduziert und f\u00fcr einen Ausgleich zwischen Frau und Mann gesorgt, aber auch im positiven Regard fanden sich problematische Biases, die unber\u00fchrt blieben.<\/p>\n<p>Der Trigger-Ansatz ist attraktiv, da er auf bereits trainierte Modelle anwendbar ist und sogar vermutlich auf gr\u00f6\u00dfere Modelle generalisiert. Die hier vorgestellte Arbeit gibt dazu zumindest erste Hinweise. Dennoch ist die Anwendbarkeit in echten Anwendungen in der aktuellen Form eher nicht gegeben. Die Trigger wirken nicht nur auf den Regard eines Satzes ein, sondern bringen auch eine thematische Verschiebung mit sich.<\/p>\n<p>Messung und Mitigierung sind nicht trivial und es kann noch eine Weile dauern bis die Forschung gute L\u00f6sungen hervorgebracht hat. Bis dahin braucht es vor allen Dingen ein Umdenken im Fachbereich. Die Evaluation von Modellen muss zum Beispiel standardm\u00e4\u00dfig disaggregiert stattfinden, um eventuelle Biases fr\u00fch zu entdecken und dokumentierbar zu machen (z. B. mithilfe von Model Cards; <a href=\"https:\/\/arxiv.org\/abs\/1810.03993?ref=hackernoon.com\">Mitchell et al., 2018<\/a>). Datens\u00e4tze, ihre Quellen und Annotator:innen-Demographien sollten ebenfalls transparent dokumentiert sein (siehe Datasheets for Datasets; <a href=\"https:\/\/cacm.acm.org\/magazines\/2021\/12\/256932-datasheets-for-datasets\/fulltext\">Gebru et al., 2021<\/a>) und die Inhalte idealerweise kuratiert.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Dieser Artikel zeigt auf, wie sich Bias in Natural Language Generation (NLG) durch gro\u00dfe Sprachmodelle wie GPT-2 und GPT-3 nachweisen l\u00e4sst und ob bzw. wie man Bias in vortrainierten Modellen abschw\u00e4chen kann.<\/p>\n","protected":false},"author":270,"featured_media":33461,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"ep_exclude_from_search":false,"footnotes":""},"tags":[575,140,141],"service":[76,75],"coauthors":[{"id":270,"display_name":"Angelie Kraft","user_nicename":"angelie-kraft"}],"class_list":["post-33397","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","tag-bert","tag-machine-learning","tag-nlp","service-artificial-intelligence","service-nlp"],"acf":[],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.6 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht - inovex GmbH<\/title>\n<meta name=\"description\" content=\"Social Bias in Natural Language Generation (NLG) l\u00e4sst sich nachweisen, doch wie l\u00e4sst er sich durch vortrainierte Modelle abschw\u00e4chen?\" \/>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/\" \/>\n<meta property=\"og:locale\" content=\"de_DE\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht - inovex GmbH\" \/>\n<meta property=\"og:description\" content=\"Social Bias in Natural Language Generation (NLG) l\u00e4sst sich nachweisen, doch wie l\u00e4sst er sich durch vortrainierte Modelle abschw\u00e4chen?\" \/>\n<meta property=\"og:url\" content=\"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/\" \/>\n<meta property=\"og:site_name\" content=\"inovex GmbH\" \/>\n<meta property=\"article:publisher\" content=\"https:\/\/www.facebook.com\/inovexde\" \/>\n<meta property=\"article:published_time\" content=\"2021-12-09T15:59:14+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2022-11-17T09:29:08+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning.png\" \/>\n\t<meta property=\"og:image:width\" content=\"1440\" \/>\n\t<meta property=\"og:image:height\" content=\"810\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/png\" \/>\n<meta name=\"author\" content=\"Angelie Kraft\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:image\" content=\"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning-1024x576.png\" \/>\n<meta name=\"twitter:creator\" content=\"@inovexgmbh\" \/>\n<meta name=\"twitter:site\" content=\"@inovexgmbh\" \/>\n<meta name=\"twitter:label1\" content=\"Verfasst von\" \/>\n\t<meta name=\"twitter:data1\" content=\"Angelie Kraft\" \/>\n\t<meta name=\"twitter:label2\" content=\"Gesch\u00e4tzte Lesezeit\" \/>\n\t<meta name=\"twitter:data2\" content=\"12\u00a0Minuten\" \/>\n\t<meta name=\"twitter:label3\" content=\"Written by\" \/>\n\t<meta name=\"twitter:data3\" content=\"Angelie Kraft\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\\\/\\\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#article\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/\"},\"author\":{\"name\":\"Angelie Kraft\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#\\\/schema\\\/person\\\/2e291fc1f5337b5e7ae5887e8ce882c0\"},\"headline\":\"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht\",\"datePublished\":\"2021-12-09T15:59:14+00:00\",\"dateModified\":\"2022-11-17T09:29:08+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/\"},\"wordCount\":2233,\"commentCount\":0,\"publisher\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#organization\"},\"image\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.inovex.de\\\/wp-content\\\/uploads\\\/social-bias-in-machine-learning.png\",\"keywords\":[\"BERT\",\"Machine Learning\",\"nlp\"],\"articleSection\":[\"Analytics\",\"General\"],\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/\",\"url\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/\",\"name\":\"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht - inovex GmbH\",\"isPartOf\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#primaryimage\"},\"image\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#primaryimage\"},\"thumbnailUrl\":\"https:\\\/\\\/www.inovex.de\\\/wp-content\\\/uploads\\\/social-bias-in-machine-learning.png\",\"datePublished\":\"2021-12-09T15:59:14+00:00\",\"dateModified\":\"2022-11-17T09:29:08+00:00\",\"description\":\"Social Bias in Natural Language Generation (NLG) l\u00e4sst sich nachweisen, doch wie l\u00e4sst er sich durch vortrainierte Modelle abschw\u00e4chen?\",\"breadcrumb\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#breadcrumb\"},\"inLanguage\":\"de\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#primaryimage\",\"url\":\"https:\\\/\\\/www.inovex.de\\\/wp-content\\\/uploads\\\/social-bias-in-machine-learning.png\",\"contentUrl\":\"https:\\\/\\\/www.inovex.de\\\/wp-content\\\/uploads\\\/social-bias-in-machine-learning.png\",\"width\":1440,\"height\":810,\"caption\":\"Header Artikelbild Illustration Gehirn\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/social-bias-ki-modelle\\\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#website\",\"url\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/\",\"name\":\"inovex GmbH\",\"description\":\"\",\"publisher\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#organization\"},\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"de\"},{\"@type\":\"Organization\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#organization\",\"name\":\"inovex GmbH\",\"url\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/\",\"logo\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#\\\/schema\\\/logo\\\/image\\\/\",\"url\":\"https:\\\/\\\/www.inovex.de\\\/wp-content\\\/uploads\\\/2021\\\/03\\\/inovex-logo-16-9-1.png\",\"contentUrl\":\"https:\\\/\\\/www.inovex.de\\\/wp-content\\\/uploads\\\/2021\\\/03\\\/inovex-logo-16-9-1.png\",\"width\":1921,\"height\":1081,\"caption\":\"inovex GmbH\"},\"image\":{\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#\\\/schema\\\/logo\\\/image\\\/\"},\"sameAs\":[\"https:\\\/\\\/www.facebook.com\\\/inovexde\",\"https:\\\/\\\/x.com\\\/inovexgmbh\",\"https:\\\/\\\/www.instagram.com\\\/inovexlife\\\/\",\"https:\\\/\\\/www.linkedin.com\\\/company\\\/inovex\",\"https:\\\/\\\/www.youtube.com\\\/channel\\\/UC7r66GT14hROB_RQsQBAQUQ\"]},{\"@type\":\"Person\",\"@id\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/#\\\/schema\\\/person\\\/2e291fc1f5337b5e7ae5887e8ce882c0\",\"name\":\"Angelie Kraft\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"de\",\"@id\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/caf11083fef5a9e159515d2eb03563cba4b525c164a8ec948e700803f1c03374?s=96&d=retro&r=g11010dd937e52ba56c045006353a63bf\",\"url\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/caf11083fef5a9e159515d2eb03563cba4b525c164a8ec948e700803f1c03374?s=96&d=retro&r=g\",\"contentUrl\":\"https:\\\/\\\/secure.gravatar.com\\\/avatar\\\/caf11083fef5a9e159515d2eb03563cba4b525c164a8ec948e700803f1c03374?s=96&d=retro&r=g\",\"caption\":\"Angelie Kraft\"},\"url\":\"https:\\\/\\\/www.inovex.de\\\/de\\\/blog\\\/author\\\/angelie-kraft\\\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht - inovex GmbH","description":"Social Bias in Natural Language Generation (NLG) l\u00e4sst sich nachweisen, doch wie l\u00e4sst er sich durch vortrainierte Modelle abschw\u00e4chen?","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/","og_locale":"de_DE","og_type":"article","og_title":"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht - inovex GmbH","og_description":"Social Bias in Natural Language Generation (NLG) l\u00e4sst sich nachweisen, doch wie l\u00e4sst er sich durch vortrainierte Modelle abschw\u00e4chen?","og_url":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/","og_site_name":"inovex GmbH","article_publisher":"https:\/\/www.facebook.com\/inovexde","article_published_time":"2021-12-09T15:59:14+00:00","article_modified_time":"2022-11-17T09:29:08+00:00","og_image":[{"width":1440,"height":810,"url":"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning.png","type":"image\/png"}],"author":"Angelie Kraft","twitter_card":"summary_large_image","twitter_image":"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning-1024x576.png","twitter_creator":"@inovexgmbh","twitter_site":"@inovexgmbh","twitter_misc":{"Verfasst von":"Angelie Kraft","Gesch\u00e4tzte Lesezeit":"12\u00a0Minuten","Written by":"Angelie Kraft"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#article","isPartOf":{"@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/"},"author":{"name":"Angelie Kraft","@id":"https:\/\/www.inovex.de\/de\/#\/schema\/person\/2e291fc1f5337b5e7ae5887e8ce882c0"},"headline":"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht","datePublished":"2021-12-09T15:59:14+00:00","dateModified":"2022-11-17T09:29:08+00:00","mainEntityOfPage":{"@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/"},"wordCount":2233,"commentCount":0,"publisher":{"@id":"https:\/\/www.inovex.de\/de\/#organization"},"image":{"@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#primaryimage"},"thumbnailUrl":"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning.png","keywords":["BERT","Machine Learning","nlp"],"articleSection":["Analytics","General"],"inLanguage":"de","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/","url":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/","name":"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht - inovex GmbH","isPartOf":{"@id":"https:\/\/www.inovex.de\/de\/#website"},"primaryImageOfPage":{"@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#primaryimage"},"image":{"@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#primaryimage"},"thumbnailUrl":"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning.png","datePublished":"2021-12-09T15:59:14+00:00","dateModified":"2022-11-17T09:29:08+00:00","description":"Social Bias in Natural Language Generation (NLG) l\u00e4sst sich nachweisen, doch wie l\u00e4sst er sich durch vortrainierte Modelle abschw\u00e4chen?","breadcrumb":{"@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#breadcrumb"},"inLanguage":"de","potentialAction":[{"@type":"ReadAction","target":["https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/"]}]},{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#primaryimage","url":"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning.png","contentUrl":"https:\/\/www.inovex.de\/wp-content\/uploads\/social-bias-in-machine-learning.png","width":1440,"height":810,"caption":"Header Artikelbild Illustration Gehirn"},{"@type":"BreadcrumbList","@id":"https:\/\/www.inovex.de\/de\/blog\/social-bias-ki-modelle\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/www.inovex.de\/de\/"},{"@type":"ListItem","position":2,"name":"Social Bias in gro\u00dfen KI-Modellen und wie man damit umgeht"}]},{"@type":"WebSite","@id":"https:\/\/www.inovex.de\/de\/#website","url":"https:\/\/www.inovex.de\/de\/","name":"inovex GmbH","description":"","publisher":{"@id":"https:\/\/www.inovex.de\/de\/#organization"},"potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/www.inovex.de\/de\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"de"},{"@type":"Organization","@id":"https:\/\/www.inovex.de\/de\/#organization","name":"inovex GmbH","url":"https:\/\/www.inovex.de\/de\/","logo":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/www.inovex.de\/de\/#\/schema\/logo\/image\/","url":"https:\/\/www.inovex.de\/wp-content\/uploads\/2021\/03\/inovex-logo-16-9-1.png","contentUrl":"https:\/\/www.inovex.de\/wp-content\/uploads\/2021\/03\/inovex-logo-16-9-1.png","width":1921,"height":1081,"caption":"inovex GmbH"},"image":{"@id":"https:\/\/www.inovex.de\/de\/#\/schema\/logo\/image\/"},"sameAs":["https:\/\/www.facebook.com\/inovexde","https:\/\/x.com\/inovexgmbh","https:\/\/www.instagram.com\/inovexlife\/","https:\/\/www.linkedin.com\/company\/inovex","https:\/\/www.youtube.com\/channel\/UC7r66GT14hROB_RQsQBAQUQ"]},{"@type":"Person","@id":"https:\/\/www.inovex.de\/de\/#\/schema\/person\/2e291fc1f5337b5e7ae5887e8ce882c0","name":"Angelie Kraft","image":{"@type":"ImageObject","inLanguage":"de","@id":"https:\/\/secure.gravatar.com\/avatar\/caf11083fef5a9e159515d2eb03563cba4b525c164a8ec948e700803f1c03374?s=96&d=retro&r=g11010dd937e52ba56c045006353a63bf","url":"https:\/\/secure.gravatar.com\/avatar\/caf11083fef5a9e159515d2eb03563cba4b525c164a8ec948e700803f1c03374?s=96&d=retro&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/caf11083fef5a9e159515d2eb03563cba4b525c164a8ec948e700803f1c03374?s=96&d=retro&r=g","caption":"Angelie Kraft"},"url":"https:\/\/www.inovex.de\/de\/blog\/author\/angelie-kraft\/"}]}},"_links":{"self":[{"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/posts\/33397","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/users\/270"}],"replies":[{"embeddable":true,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/comments?post=33397"}],"version-history":[{"count":6,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/posts\/33397\/revisions"}],"predecessor-version":[{"id":33460,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/posts\/33397\/revisions\/33460"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/media\/33461"}],"wp:attachment":[{"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/media?parent=33397"}],"wp:term":[{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/tags?post=33397"},{"taxonomy":"service","embeddable":true,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/service?post=33397"},{"taxonomy":"author","embeddable":true,"href":"https:\/\/www.inovex.de\/de\/wp-json\/wp\/v2\/coauthors?post=33397"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}