Virtuell assistent : Meddelande om förklarbarhet
Publio – den intelligenta assistenten på portalen för EU:s publikationsbyrå (OP-portalen)
Senaste uppdatering: 16 maj 2023
Innehåll
- Transparens med avseende på artificiell intelligens (AI) – allmänna principer
- Tillförlitlig, förklarande AI
- AI och ansvar
- Om Publio
- Vad är Publio?
- Vilken typ av data använder Publio?
- Hur fungerar Publio?
- Hur analyserar Publio en fråga och föreslår resultat?
- Din feedback
- Behandling av personuppgifter
- Begränsningar just nu
Publio, den intelligenta assistenten på portalen för EU:s publikationsbyrå, är ett verktyg för artificiell intelligens (AI) som interagerar med fysiska personer och utför sökningar med hjälp av nyckelord baserat på information som är allmänt tillgänglig på portalen.
I detta meddelande om förklarbarhet får du information om regelverket för artificiell intelligens och de principer som styr Publios funktion i detta sammanhang. EU:s publikationsbyrå strävar efter transparens och tillförlitlig, förklarande AI.
Transparens med avseende på artificiell intelligens (AI) – allmänna principer
Inom EU-institutionernas verksamhet är transparens och öppenhet centrala faktorer för en god förvaltning och civilsamhällets deltagande, i enlighet med artikel 15 i fördraget om Europeiska unionens funktionssätt (EUF-fördraget), där följande föreskrivs:
”1. För att främja en god förvaltning och se till att det civila samhället kan delta ska unionens institutioner, organ och byråer utföra sitt arbete så öppet som möjligt.”
I artikel 41 (rätt till god förvaltning) i EU-stadgan om de grundläggande rättigheterna fastställs förvaltningens skyldighet att motivera sina beslut.
I dokumentet Etiska riktlinjer för tillförlitlig AI (fotnot 1), som är en serie riktlinjer utarbetade 2019 av den högnivåexpertgrupp för artificiell intelligens som inrättats av EU-kommissionen, anges transparens som ett av sju krav (fotnot 2) som AI-system bör uppfylla. I dessa riktlinjer föreskrivs vidare att transparens är en del av principen om förklarbarhet, enligt vilken dataset och tekniska processer måste vara transparenta och det måste finnas en öppen kommunikation om AI-systemens kapacitet och syfte. Dataseten och de tekniska processerna måste därför dokumenteras samt gå att spåra, förklara och tolka.
De ovannämnda principerna ska tillämpas på utvecklingen, spridningen och användningen av AI-baserade lösningar och verktyg av EU:s institutioner, organ och byråer.
Baserat på dessa allmänna principer måste du som interagerar med ett AI-system få uttrycklig information om att så är fallet. Du kan då göra ett medvetet val mellan att fortsätta interaktionen eller avstå från att använda verktyget.
Enligt reglerna om transparens ska du också få den information som krävs för att kunna tolka systemets utdata och använda utdatan på ett lämpligt sätt.
Tillförlitlig, förklarande AI
EU har tillförlitlig och förklarande AI som centralt mål och arbetar med att ta fram ett regelverk för AI. I kommissionens förslag av den 21 april 2021 till förordning om harmoniserade regler för artificiell intelligens (AI-rättsakten) (fotnot 3) införs två huvudsakliga typer av åtaganden från leverantörer av AI-baserade lösningar och verktyg – transparens och tillhandahållande av information.
Som användare av AI-system har du rätt att få information. Denna rättighet hör ihop med motsvarande skyldigheter, såsom skyldigheten att använda systemet i enlighet med instruktionerna och att övervaka det berörda AI-verktygets prestanda. Efterlevnaden av dessa regler leder till ansvarsskyldighet för alla berörda aktörer.
I artikel 52 i förslaget till AI-rättsakt (Transparenskrav för vissa AI-system) föreskrivs följande: ”1. Leverantörer ska säkerställa att AI-system som är avsedda att interagera med fysiska personer utformas och utvecklas på ett sådant sätt att fysiska personer informeras om att de interagerar med ett AI-system, såvida detta inte är uppenbart på grund av användningens omständigheter och sammanhang. […]”
Förslaget till AI-rättsakt följer en riskbaserad metod där man skiljer mellan användning av AI som skapar i) oacceptabel risk, ii) hög risk och iii) låg eller minimal risk.
Publio, den intelligenta assistenten på Publikationsbyråns portal, interagerar med fysiska personer och utför sökningar med hjälp av nyckelord baserat på information som är allmänt tillgänglig på portalen. Denna information offentliggörs enligt den princip om insyn som ligger till grund för all EU:s politik och lagstiftning. Den intelligenta assistenten genererar inget nytt innehåll. Den manipulerar eller påverkar inte heller de val du gör, utöver att föreslå möjliga filtreringsalternativ för dina sökningar. Publio ska därför anses omfattas av kategorin iii) ”låg risk” enligt förslaget till AI-rättsakt.
I avdelning IV (Transparens) i förslaget till AI-rättsakt föreskrivs att AI-systemens utformning och funktion måste ta hänsyn till de särskilda risker som dessa kan medföra för 1) manipulation genom subliminal teknik, dvs. teknik som du som användare inte är medveten om, eller 2) utnyttjande av utsatta grupper som sannolikt orsakar psykisk eller fysisk skada. Strängare transparenskrav kommer att gälla för system som i) interagerar med människor, ii) används för att läsa av känslor eller fastställa en koppling till (sociala) kategorier baserade på biometriska uppgifter, eller iii) genererar eller manipulerar innehåll (”deepfake”). Publio interagerar med fysiska personer men kan inte läsa av känslor i syfte att manipulera. Verktyget innehåller inte heller några element som av misstag skulle kunna leda till ett sådant utfall. Publio stämmer därför inte in på ovannämnda kriterier.
AI och ansvar
EU-kommissionens förslag till AI-rättsakt kompletterades den 28 september 2022 med ett förslag om en skadeståndsordning för AI – direktivet om skadeståndsansvar gällande AI (fotnot 4), efter en resolution av Europaparlamentet som antogs i enlighet med artikel 225 i EUF-fördraget (fotnot 5).
I förslaget till direktiv om skadeståndsansvar gällande AI anges att de befintliga ansvarsreglerna (särskilt de som är grundade på culpa, dvs. försummelse eller oaktsamhet) inte lämpar sig för att hantera skadeståndsanspråk för skador som orsakats av AI-baserade produkter och tjänster. Enligt dessa regler måste den skadelidande bevisa att den person som orsakat skadan antingen handlade felaktigt eller felaktigt underlät att uppfylla sina skyldigheter. Den skadelidande måste även identifiera personen och fastställa ett orsakssamband. Särdragen hos AI, däribland dess komplexitet och autonomi samt bristen på insyn (den så kallade black box-effekten), gör det svårt att identifiera en person som orsakat en skada i samband med användningen av AI. Skadelidande kan därför avskräckas från att begära ersättning. Med tanke på karaktären på frågan om bevisbörda föreskrivs i förslaget till direktiv om skadeståndsansvar gällande AI innovativa lösningar i form av lättnader av de ovannämnda kraven genom användning av offentliggöranden och motbevisbara presumtioner om bristande efterlevnad.
Förslaget till direktiv om skadeståndsansvar gällande AI syftar till att ge effektiva medel för att identifiera potentiellt ansvariga personer och relevanta bevis. Där anges till exempel att en nationell domstol får besluta om utlämnande (och bevarande) av relevanta bevis om specifika AI-system med hög risk som misstänks ha orsakat skada (fotnot 6). Enligt kraven i artikel 4 i förslaget till direktiv ska nationella domstolar förutsätta att det föreligger ett orsakssamband mellan en motparts culpa (försummelse/oaktsamhet) och ett AI-systems utdata (eller underlåtenhet att producera utdata).
I motiveringen till förslaget till direktiv om skadeståndsansvar gällande AI konstateras följande: ”Sådana effektiva regler om civilrättsligt ansvar har den ytterligare fördelen att de ger alla som är involverade i verksamhet som rör AI-system ett ytterligare incitament att respektera sina skyldigheter när det gäller deras förväntade beteende.”
Om Publio
Termer och definitioner
Term | Definition |
---|---|
Auktoritetstabeller | Auktoritetstabeller används för att harmonisera och standardisera de koder och tillhörande etiketter som används i olika miljöer (webbplattformar, system och applikationer). De används också för att underlätta datautbyten mellan EU:s institutioner, till exempel i samband med beslutsprocesser. Exempel på sådana auktoritetstabeller är kodifierade förteckningar över språk, länder, företagsorgan osv. |
Chatbot | En chatbot är ett system för artificiell intelligens som kan simulera mänsklig konversation och interagera med dig som användare genom text eller tal. Den använder teknik för bearbetning av naturligt språk för att förstå och reagera på dina indata, erbjuda automatiserad assistans och information eller utföra särskilda uppgifter utifrån fördefinierade regler eller algoritmer. Chatbottar används ofta i olika applikationer, t.ex. kundtjänst, virtuella assistenter och digitala meddelandetjänster, för att förenkla kommunikationen och ge omedelbara svar på dina frågor. |
Konversations-AI | Konversations-AI är en form av artificiell intelligens som underlättar människoliknande konversationer i realtid mellan en människa och en dator. |
Konversationsflöde | Med konversationsflöde avses en smidig och logisk utveckling av en konversation (användarresa) mellan chatbotten och dig som använder den. Det handlar om hur en chatbot tolkar din avsikt, ger lämpliga svar och styr konversationen för att nå ditt angivna mål eller syfte. |
Enhet | I detta sammanhang står enhet för en uppgift som kan hämtas från dina indata och är relevant för ditt syfte, dvs. som gör det möjligt att förstå vad ditt syfte är. Denna uppgift identifieras och bevaras för att få fram exakt den information du söker. Ett exempel på en enhet kan vara upphovsmannen till en viss artikel. |
EU Vocabularies eller Eurovoc | Eurovoc (EU Vocabularies) är en särskild uppsättning flerspråkiga, ämnesövergripande auktoritetstabeller som förvaltas av Publikationsbyrån och omfattar EU:s verksamhet. Den innehåller termer på de 24 officiella EU-språken samt på tre kandidatländers språk: albanska, makedonska och serbiska. |
Avsikt | I detta sammanhang avser termen avsikt det syfte du har när du skriver in eller uttalar en fråga eller kommentar (fråga). En avsikt står för en idé eller en tanke i ditt meddelande (yttrande). Ett exempel på en avsikt är att du vill söka efter ett visst ämne, en viss publikation eller en person. |
Språkmodell | En språkmodell är en typ av AI-program som utformats för att analysera och förstå naturligt språk. Den använder statistiska metoder och sannolikhetsmetoder för att förutspå vilka ord eller fraser som sannolikt kommer att följa härnäst i en mening eller textsekvens. Det är med andra ord ett verktyg som kan användas för att generera eller avsluta meningar baserat på indatans kontext och innehåll. |
Språkförståelse (LUIS) | En molnbaserad konversations-AI-tjänst som tillämpar anpassade maskininlärningsuppgifter på en användares naturliga konversationstext för att förutspå den övergripande innebörden och hämta relevant, utförlig information. |
Maskininlärning | Maskininlärning är en typ av artificiell intelligens som gör att program kan ”lära sig” från tidigare användning och återkoppling. De blir därmed duktigare på att mer exakt förutspå utfall utan att uttryckligen programmeras för det ändamålet. |
Bearbetning av naturligt språk | Bearbetning av naturligt språk är ett AI-område som gör att datorer kan analysera och förstå mänskligt språk, både skrivet och talat. |
Sökväg | Termen sökväg avser den sekvens av interaktioner som du genomgår när du söker efter specifik information. Det handlar om den process där du vägleds genom en rad frågor och svar för att identifiera och uppfylla dina sökmål. Chatbotten ska förstå din fråga, hämta relevant information från en databas eller kunskapsbas och presentera informationen på ett sätt som är lätt att förstå och relevant för dina behov. |
Användarresa | En persons erfarenhet vid användning av en webbplats eller ett program. Den består av den serie åtgärder som utförts för att nå ett visst mål på webbplatsen eller i programmet. |
Yttrande | Indata från dig som användare som kan skrivas eller talas in under en konversation. Ett yttrande kan bestå av antingen ett enda ord eller flera ord som en fråga eller en fras. |
Vad är Publio?
Publio, den intelligenta assistenten på portalen för EU:s publikationsbyrå, är ett AI-verktyg som interagerar med fysiska personer och utför sökningar med hjälp av nyckelord baserat på information som är allmänt tillgänglig på portalen. Publio kombinerar konversations-AI-teknik, som bearbetning av naturligt språk och maskininlärning, med interaktiv röstigenkänning och traditionella söksystem för att hjälpa dig att hitta EU-publikationer, EU-lagstiftning och kontaktpersoner vid EU:s institutioner.
Den intelligenta assistenten möjliggör framför allt talade eller skrivna konversationer mellan slutanvändare och portalen och finns för närvarande på engelska, franska och spanska. Den erbjuder även en lösning för personer med lässvårigheter, vilket bidrar till ökad tillgänglighet. Du kan också använda konversationssökning, ett nytt sätt att söka som gör att du kan tala i fullständiga meningar – precis som i ett vanligt samtal – med en AI-röstassistent som ger dig svar, där utbytet med den intelligenta assistenten sker i konversationsform.
Vilken typ av data använder Publio?
Publio använder information som är allmänt tillgänglig på Publikationsbyråns portal. Denna information offentliggörs enligt den princip om insyn som gäller för all EU:s politik och lagstiftning. Baserat på denna korpus använder Publio klassificeringar och kategorier från portalen, t.ex. Eurovoc-ämnen, upphovsmän eller format för att styra och renodla konversationen i syfte att hjälpa dig att söka i portalens tre huvudsamlingar: EU-publikationer, EU-rätten och EU:s elektroniska institutionskatalog (EU Whoiswho).
Publio använder en befintlig språkmodell för att förstå dina frågor och vägleda dig i ditt sökande. Ytterligare förbättring av Publios språkmodell och dess inlärning sker löpande och utifrån feedback från användarna för att uppfylla användarnas förväntningar och hantera mångfalden av indatan på de tre språk som stöds.
Denna inlärning omfattar flera olika komponenter i Publios underliggande system:
- En fördefinierad serie yttranden som associeras med olika möjliga former av avsikt för att Publio först och främst ska kunna förstå ditt slutmål och sedan vägleda dig mot det målet steg för steg.
- En fördefinierad serie fastställda frågor som Publio ”förstår” och kan besvara. Exempel: ”Hur kan jag beställa publikationer?”
- Maskininlärda enheter som kan identifieras av Publio och användas i Publios bakgrundsprocesser för att upptäcka sökparametrar samt ge mer exakta sökresultat eller alternativ för att ytterligare förfina sökningen. Dessa enheter baseras på befintliga klassificeringar och kategorier av uppgifter, t.ex. tesaurusen Eurovoc eller andra behörighetstabeller som förvaltas av EuroVoc: upphovsmän, format, språk, EU-organ (organisationer), funktioner inom EU:s offentliga förvaltning m.m. Det innebär att Publio till exempel kan förstå din fråga, dvs. att du letar efter en publikation i ett visst ämne eller av en viss upphovsman.
Hur fungerar Publio?
Publio använder sig av Microsofts språkförståelse (LUIS) (fotnot 7) för att bearbeta dina indata (ett skrivet eller talat yttrande), förstå din avsikt och identifiera de centrala delar (enheter) som du är intresserad av. Baserat på den identifierade avsikten inleder Publio ett skräddarsytt konversationsflöde som ska hjälpa dig att nå det önskade resultatet i några enkla steg.
För närvarande kan Publio inleda fyra huvudsakliga konversationsflöden:
- Ett dokumentsökningsflöde för att söka efter EU-publikationer eller EU-rättsakter.
- Ett personsökningsflöde för att söka efter anställda vid EU:s institutioner.
- Ett organisationssökningsflöde för att söka efter EU-organ (organisationer).
- Ett flöde för frågor och svar för att besvara vanliga frågor med fördefinierade svar.
Om ett sökflöde identifieras hjälper den virtuella assistenten dig att hitta ett dokument, en person eller en organisation genom att ställa enkla frågor och föreslå filtreringsalternativ beroende på vad du svarar.
När det gäller flödet för frågor och svar upprätthåller Publikationsbyråns personal en förteckning över vanliga frågor och svar. Om avsikten när det gäller frågor och svar identifieras och din fråga är mycket lik en av frågorna i systemet får du direkt ett lämpligt svar. Exempel:
– Om avsikten identifieras med frågan ”Var är min beställning?” svarar assistenten ”Du kan kontrollera statusen för din beställning under Min beställning i din profil”.
– Om avsikten identifieras med frågan ”Var kan jag hitta dokument för barn?” svarar assistenten ”Publikationer för barn finns i Barnhörnan”.
Dina frågor kan vara både skriftliga och muntliga. Om du ställer en muntlig fråga registrerar chatbotten ljudet och skickar det till ett taligenkänningsverktyg som omvandlar ditt tal till text. Ljudet behandlas av Microsoft Azures Tal till text-tjänst (fotnot 8). Publio visar sedan din intalade fråga som text för att därefter ge dig svaret skriftligen och i talad form med hjälp av talsyntes. Detta utbyte sker omedelbart och lämnar inga spår.
Hur analyserar Publio en fråga och föreslår resultat?
Publio använder inte generativ teknik och kan därför inte generera eller manipulera användarinnehåll.
Publio använder en språkmodell som bygger på maskininlärning och är programmerad till att lära sig känna igen och besvara dina indata (en s.k. tränad språkmodell). Ditt meddelande eller din fråga behandlas i modellen, som sedan identifierar meddelandets avsikt och ger ett lämpligt svar. Publios inlärning går till så att maskininlärningsmodellen förses med en stor mängd märkta inlärningsdata som innehåller exempel på användarnas indata samt deras motsvarande avsikter och rimliga svar.
Publio använder bearbetning av naturligt språk och den tränade språkmodellen för att förstå din avsikt och för att få fram igenkända enheter från din fråga (t.ex. sökord, ämne, upphovsman samt datum eller format för dokumentet). Publio använder dessa enheter för att utföra sökningen och visa sökresultatet.
Om sökresultatet är för omfattande kommer Publio att ställa ytterligare frågor för att begränsa sökresultatet genom att filtrera på andra enheter.
Publios frågor är endast till för att identifiera din avsikt, förstå dess syfte och formulera rätt sökfråga i korpusen för det publicerade innehållet på portalen. De resultat som Publio föreslår kommer alla från denna korpus.
Din feedback
När som helst under konversationen kan du ge positiv, neutral eller negativ feedback om hur det är att använda Publio. Du kan ge manuell feedback när som helst eller som svar på ett popup-fönster som dyker upp efter några sekunders inaktivitet. Om Publio inte uppfattar en fråga korrekt loggas den dessutom automatiskt och behandlas regelbundet av Publikationsbyråns personal. Både feedbacken från användarna och analysen av frågor som Publio inte uppfattat används för att lära om språkmodellen för att kontinuerligt förbättra tjänsterna för slutanvändarna.
Behandling av personuppgifter
De uppgifter som finns tillgängliga på Publikationsbyråns portal behandlas i enlighet med EU:s allmänna dataskyddsförordning och förordningen om behandling av personuppgifter som utförs av EU:s institutioner, organ och byråer (fotnot 9).
Inga uppgifter lagras, bevaras eller arkiveras av Publio, varken dina indata eller uppgifterna i Publios svar.
Den feedback du lämnar är anonym och kan inte kopplas till dig.
Inga personuppgifter används för automatiserat beslutsfattande, spårning eller profilering.
Begränsningar just nu
- Transkription av namn via talfunktionen: De flesta namn uppfattas och transkriberas på ett korrekt sätt. Funktionen bygger dock på maskininlärning och stämmer inte till 100 procent. På grund av begränsningar i LUIS händer det att vissa namn skrivs ut fel även efter att modellen har tränats med de specifika exemplen från datasetet.
- Datum på franska och spanska: Förståelsen av datum på spanska och franska är mindre exakt i mer komplexa fraser. På spanska kommer till exempel året att urskiljas i frasen ”entre 2016 y 2017” utan ytterligare kontext, medan det inte kommer att göra det i frasen ”entre el año 2019 y 2020”. På engelska identifieras ”2 years ago”, medan det franska ”il y a 2 ans” inte gör det.
- Taligenkänning fungerar endast på ett språk i taget.
- Taligenkänningen har inte något stavningsläge, dvs. det finns ingen funktion som gör att du kan uttala ord bokstav för bokstav för att se till att det skrivs ut korrekt.
- Igenkänningen av namnenheter fungerar dåligt i längre fraser när de kombineras med ”Mrs”/”Miss”.
Europeiska unionens publikationsbyrå, den 16 maj 2023
1 Finns på https://ec.europa.eu/futurium/en/ai-alliance-consultation.1.html.
2 De sju kraven för tillförlitlig AI är 1) mänskligt agentskap och mänsklig tillsyn, 2) teknisk robusthet och säkerhet, 3) integritet och god dataförvaltning, 4) transparens, 5) mångfald, icke-diskriminering och rättvisa, 6) samhällets och miljöns välbefinnande samt 7) ansvarsskyldighet.
3 Europaparlamentets och rådets förordning om harmoniserade regler för artificiell intelligens (förordningen om artificiell intelligens) och om ändring av vissa EU-lagstiftningsakter. Läs den antagna och undertecknade förordningen.
4 Förslag till Europaparlamentets och rådets direktiv om anpassning av reglerna om utomobligatoriskt skadeståndsansvar vad gäller artificiell intelligens (direktivet om skadeståndsansvar gällande AI), Bryssel, 28.9.2022, COM(2022) 496 final.
5 Europaparlamentets resolution av den 20 oktober 2020 med rekommendationer till kommissionen om en skadeståndsordning för artificiell intelligens (2020/2014(INL)).
6 Se artikel 3.
8 https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE5cCGB.
9 Förordning (EU) 2016/679, EUT L 119, 4.5.2016, s. 1 och förordning (EU) 2018/1725, EUT L 295, 21.11.2018, s. 39.