Så håller du AI-bottarna borta från din webbplats

av Mikael Winterkvist | feb 17, 2024 | ai, Bluesky, Mastodon, Nätfrihet

AI, Articifiell Intelligens, bygger ofta på att stora mängder data samlas in och som sedan används för att träna AI-programmet på. Ju mer data, ju färskare data desto bättre blir AI-programmet – enkelt förklarat. I detta datainsamlande så är din blogg, dina texter och bilder intressanta. Magasin Macken tipsar om hur du kan stoppa AI-bottarna.

För att vara tydlig – denna metod stoppar inte alla AI-program, inte alla lottar, men flera av dem.

Robots.txt

I root-katalogen på alla webbplatser finns en fil, robots.txt, som anger vilka besökare som är välkomna och vilka som inte är det. Här kan du ange vilka lottar, sökmotorer och andra automatiska funktioner som får, eller som inte får, indexera och samla in information från din blogg, hemsida och/eller e-butik. Filmen och metoden är alltså inte heltäckande eller en metod som stoppar alla bottar men många.

Det du ska göra är att redigera filen och lägga till texten nedan:

User-agent: CCBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /
User-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Omgilibot
Disallow: /
User-agent: Omgili
Disallow: /
User-agent: FacebookBot
Disallow: /
User-agent: Amazonbot
Disallow: /
User-agent: cohere-ai
Disallow: /
User-agent: Teoma
Disallow: /
User-agent: Gigabot
Disallow: /
User-agent: Robozilla
Disallow: /
User-agent: Nutch
Disallow: /
User-agent: psbot
Disallow: /
User-agent: SentiBot
Disallow: /
User-agent: sentibot

Lagligt

Den här typen av datainsamling brukar kallas ”data scraping” och är inte olagligt, vilket det är viktigt att understryka. Det är inte olagligt att indexera din webbplats, samla in information och sedan lagra för eget eller andras bruk. Skulle det vara olagligt så skulle nätets sökmotorer inte kunna samla in information och göra den sökbar – för att ta en orimlig konsekvens och exempel om datainsamlandet skulle vara olagligt.

Seriösa aktörer respekterar det som står i robots.txt men som sagt räkna inte med att alla gör det.

0 kommentarer

Mikael Winterkvist

Fyrabarns-far, farfar, morfar och egen företagare i Skellefteå med kliande fingrar. Jag skriver om fotografering, sport, dataprylar, politik, nöje, musik och film. Vid sidan av den här bloggen så jobbar jag med med det egna företaget Winterkvist.com. Familjen består av hustru, fyra barn (utflugna) och fem barnbarn.

Jag har hållit på med datorer sedan tidigt 1980-tal och drev Artic BBS innan Internet knappt existerade. Efter BBS-tiden har det blivit hemsidor, design, digitala medier och trycksaker. Under tiden som journalist jobbade jag med Mac men privat har det varit Windows som har gällt fram till vintern 2007. Då var det dags att byta och då bytte vi, företaget, helt produktionsplattform till macOS. På den vägen är det.

_____________________________________________________________________________________

Anmäl dig till Magasin Mackens nyhetsbrev

Du får förhandsinformation om Macken, våra planer och du får informationen, först och direkt till din mail. Vi lovar att inte skicka din information vidare och vi lovar att inte skicka ut mer än max ett nyhetsbrev per månad.

Anmäl dig här

_____________________________________________________________________________________