Så håller du AI-bottarna borta från din webbplats

Så håller du AI-bottarna borta från din webbplats

white robot wallpaper

AI, Articifiell Intelligens, bygger ofta på att stora mängder data samlas in och som sedan används för att träna AI-programmet på. Ju mer data, ju färskare data desto bättre blir AI-programmet – enkelt förklarat. I detta datainsamlande så är din blogg, dina texter och bilder intressanta. Magasin Macken tipsar om hur du kan stoppa AI-bottarna.

För att vara tydlig – denna metod stoppar inte alla AI-program, inte alla lottar, men flera av dem.

Robots.txt

I root-katalogen på alla webbplatser finns en fil, robots.txt, som anger vilka besökare som är välkomna och vilka som inte är det. Här kan du ange vilka lottar, sökmotorer och andra automatiska funktioner som får, eller som inte får, indexera och samla in information från din blogg, hemsida och/eller e-butik. Filmen och metoden är alltså inte heltäckande eller en metod som stoppar alla bottar men många.

Det du ska göra är att redigera filen och lägga till texten nedan:

User-agent: CCBot
Disallow: /
User-agent: ChatGPT-User
Disallow: /
User-agent: GPTBot
Disallow: /
User-agent: Google-Extended
Disallow: /
User-agent: anthropic-ai
Disallow: /
User-agent: Omgilibot
Disallow: /
User-agent: Omgili
Disallow: /
User-agent: FacebookBot
Disallow: /
User-agent: Amazonbot
Disallow: /
User-agent: cohere-ai
Disallow: /
User-agent: Teoma
Disallow: /
User-agent: Gigabot
Disallow: /
User-agent: Robozilla
Disallow: /
User-agent: Nutch
Disallow: /
User-agent: psbot
Disallow: /
User-agent: SentiBot
Disallow: /
User-agent: sentibot

Lagligt

Den här typen av datainsamling brukar kallas ”data scraping” och är inte olagligt, vilket det är viktigt att understryka. Det är inte olagligt att indexera din webbplats, samla in information och sedan lagra för eget eller andras bruk. Skulle det vara olagligt så skulle nätets sökmotorer inte kunna samla in information och göra den sökbar – för att ta en orimlig konsekvens och exempel om datainsamlandet skulle vara olagligt.

Seriösa aktörer respekterar det som står i robots.txt men som sagt räkna inte med att alla gör det.

Nu attackeras journalister med Pegasus, igen

Nu attackeras journalister med Pegasus, igen

Spionprogrammet Pegasus används nu, igen, för att attackera journalister skriver Freedom of the Press Foundation. Den här gången handlar det jordanska journalister som attackeras i vad som bär alla tecken på att vara en statsunderstödd attack.

Organisationen Access Now har gått igenom och analyserat mobila enheter från minst 30 jordanska journalister, aktivister, advokater och andra civila tillsammans med Citizen Lab vid University of Toronto. I deras rapporten finns även information från Human Rights Watch, Amnesty International och Organized Crime and Corruption Reporting Project där fem ytterligare mobila enheter har analyserats.

’Det innebär att NSOs ökända spionprogram, Pegasus,  har hittats i minst 35 enheter varav 16 av dem tillhör journalister.

”Vi tror att detta bara är toppen av isberget när det gäller användningen av Pegasus spionprogram i Jordanien, och att det verkliga antalet offer sannolikt är mycket högre.”

Access Now

LockDown

Av rapporten framgår att forskarna har konstaterat att Apples ”LockDown” läge har blockerat vissa försök att infektera en Apple-enhet med Pegasus. För Android-enheter så är läget mer komplicerat. Här finns Mobile Verification Toolkit vilket kan upptäcka Pegasus men det kräver tekniska kunskaper för att installeras.

Statsunderstödd attack

Då det handlar om en riktad attack – mot jordanska journalister, advokater och människorättsaktivister så är slutsatsen att det handlar om en statsunderstödd attack eller en attack genomförd av en stat och det är ingen långsökt slutats att tro att det handla om den jordanska regimen. Jordan, en parlamentarisk monarki, ligger på 34:e plats, av 100 på Freedom House lista över länder som rankas ute efter hur fria länderna är. Efter det att flera hårda restriktioner införs i landet på senare år så har Jordan fallit från 37:e plats till en 34:e plats och landet rankas som ”inte fritt”.

Freedom House

The Dark Web är en livlina för användare

The Dark Web är en livlina för användare

The Dark Web är en livlina för användare

The Dark Web är en livlina för användare

Det brukar kallas the Dark Web och det beskrivs som en plats för droghandel, vapenhandel, hackare och en plats dit vanliga nätanvändare inte når. Sanningen är även en annan. Den här delen av nätet är den enda möjligheten för medborgare i slutna länder och diktaturer för att överhuvudtaget ta sig ut på nätet.

The Dark Web och Tor-projektet brukar klumpas ihop och nämnas i samma andetag och det är tekniskt korrekt men Tor-projektet handlar inte bara om olagligheter – tvärtom.

Öppet nät

Tor-projektet grundades för att garantera ett fritt, öppet och anonymt nät. Det är ett nät och det är utveckling och underhåll av mjukvara. För att kunna använda den här delen av nätet krävs speciell mjukvara – en webbläsare som gör att du surfar anonymt men där slutar också alla spärrar och hinder.

Det kan låta mer komplicerat än det är och du kan ladda ned Tors mjukvara, gratis från deras webbplats. Det är inte mycket mer komplicerat än att läsa innantill och installera. Det finns webbläsare och mjukvara även för iOS.

Tor är alltså ett parallellt nät och en del av Internet där trafiken krypteras och där du surfar anonymt, enkelt utryckt.

 

 

Diktaturer

Här finns Facebook, Twitter och flera av de vanliga webbplatserna som vi alla använder. Skillnaden är att inom ramen för Tor så fungerar de webbplatserna som en slags frihetens fyrtorn för miljontals användare som inte kan och som inte får använda Internet på det sätt många av oss tar för givet. Deras access till information är begränsad av myndigheterna och Tors nät är praktiskt taget den enda vägen och möjligheten att kunna ta del av information utanför landet.

Ofta förknippas detta med diktaturer men faktum är att även länder som vi betraktar som demokratier från tid till annan stänger ned delar av nätet. Då återstår bara VPN-uppkopplingar eller Tor.

Censur

Den här delen av nätet är ingalunda stängd, hemlig eller otillgänglig. Den är tvärtom en informationsbärare för miljontals användare. Tors egna siffror säger att runt 2-3 procent av trafiken går till och från slutna, hemliga och privata adresser inom Tors nät. Det är de olagliga webbplatserna som medierna intresserar sig för och som får de stora rubrikerna. Trafiken, den övriga trafiken, handlar om närmare två miljoner användare som i första hand söker information som deras egna myndigheter inte vill att de ska kunna ta del av.

Det finns länder som helt stänger ute nätet såsom Nordkorea och Kina och så finns det länder som censurerar delar av nätet, helt eller delvis. Här finns också de länder som regelbundet stänger ned tjänster och delar av nätet.

Turkiet, Egypten, Israel och Taiwan toppar just nu den listan på länder.

Det anonyma nätet

En riktigare benämning vore att använda termen det anonyma internet, The Anonymous Internet, och Oxford Internet Institute har sammanställt en karta som utgår från Tor.

Kartan visar att vi i Sverige använder Tor i högre grad, och mer än våra grannländer, och att Italien ligger i top tillsammans med Israel. Detta sett till mängden användare i förhållande till det sammanlagda antalet nät-användare.

Här finns den mjukvara du behöver. Det är bara att ladda ned och installera.

Tor

Nej, din iPhone avlyssnar dig inte – det finns en mycket enklare förklaring

Nej, din iPhone avlyssnar dig inte – det finns en mycket enklare förklaring

black and white printed textile

”Jag är säker på att min telefon avlyssnar mig därför att jag fått reklam för YY sedan vi bara pratat om det” – känns diskussionen igen? Någon i sällskapet hävdar att den enda förklaringen till att de har fått en viss reklam är att telefonen avlyssnar dem, spelar in och skickar informationen till – oklart var.

Förklaringen till varför din telefon inte för försedd med hemlig avlyssnings- och inspelningsutrustning är att det inte behövs. Facebook, Google, Meta, Instagram och allt vad de heter har full kontroll på dig och det du gör ute på nätet ändå. Det faktum att många tror att de spelas in i hemlighet är snarare ett bevis på hur effektivt datatrålandet är ute på nätet än på att det du säger i närheten av din telefon spelas in.

Enorma datamängder

Det finns även tekniska skäl till att det inte skulle fungera. En inspelning, den fil som skapas, kommer att få en rätt ansenlig storlek, även med hög komprimering vilket betyder att överföringen skulle ta både tid och bandbredd i anspråk.

Lägg sedan till att överföringen ska göras utan att du märker det och utan att någon märker det. Alla de tekniker som befolkar nätet, som sitter och stirrar in i bildskärmar som visar trafiken ute på nätet, som övervakar trafiken och som analyserar det som skickas ska alltså inte märka något. All denna bandbredd och alla överföringar måste ske hemligt och dolt för teleoperatörerna – som inte får något betalt för all trafik heller.

Det är antingen det eller så tvingas du involvera en väldig massa människor i den här konspirationen för att få påståendet att din telefon avlyssnar dig att hålla.

Osynliga

Överföringarna måste vara helt osynliga, trots betydande datamängder, ditt batteri får inte påverkas och inte dina överföringshastigheter heller. Enorma mängder data ska sedan skickas till mottagarna, analyseras, brytas ned och utmynna i att du får se reklam för blöjor, pooler eller reservdelar till din bil.

Det finns ett fundamentalt problem med de flesta konspirationsteorier, så även med denna – sanningen måste vara känd av många och av alla dessa människor så ska ingen känna ett behov av att berätta. Ingen ska läcka.

Ska du hålla något hemligt, riktigt hemligt så:

  • Använd inte nätet
  • Se till att ett mycket litet antal individer vet om det

Topphemliga militära hemligheter, exempelvis, förvaras ofta i en pärm som ligger inlåst i ett säkert kassaskåp. Det är en manuell hantering, så långt det går en icke digital datalagring. Ett extremt litet antal enskilda har eller får tillgång till informationen.

Så, håller du saker hemliga – inte genom att skicka enorma mängder data över Internet.

Så här går det till

Så hur går det till då? Hur kan jag få reklam om ett ämne som diskuterats verbalt och som reklamsäljarha rimligen inte borde veta att jag har diskuterat?

Vi utgår från ett exempel, ett kompisgäng.

Det är ett kompisgäng hyggligt inom samma åldersspann, geografiskt inom samma område och som träffas då och då, låt oss säga för att gå på ishockey. Detta gäng interagerar med varandra via sociala medier, har en egen gruppchat via en tjänst och de har profiler där de har berättat om civilstånd, utbildningar, intressen med mera.

Några av dem har laddat upp sina adressböcker till tjänster, flertalet av dem bor i samma lilla geografiska område och alla har körkort. Låt oss nu se vad som går att utläsa om det här kompisgänget. Kortfattat kan det summeras – det mesta.

Vi vet vilken den genomsnittliga inkomsten är för den här gruppen, vi vet var de är vid givna tillfällen, vad de söker efter på nätet, vad de kan antas ha köpt, sett och vad de här när de sitter vid en dator eller håller sin telefon i handen. Tjänsterna har ett betydande underlag om alla i gruppen redan innan de samlas för att se en ishockeymatch tillsammans.

Inkomst, intressen, umgänge, tv-vanor, musikvanor, bostad, arbete, familj, utbildning – allt har samlats in.

Den reklam som fött misstanken om att telefonen avlyssnar dem handlar om erbjudanden om ett poolskydd. En ovanlig produkt där den som fått reklamen är beredd att ta gift på att han inte har sökt efter poolskydd på nätet men det har en i gruppen gjort, utan att berätta om det. Det gjordes när alla var på samma plats, under hockeymatchen. I efterhand kommer den som gjort sökningen inte ihåg vad han gjort därför att det är en vanlig, normal sak att göra då du letar efter information. Alla har dessutom i stort sett fått samma reklam men det är bara en i gruppen som reagerar.

Unika

Även om vi tror det så är vi som individer inte så unika och annorlunda att det inte går att sätta etiketter på oss. Vi gör samma saker som andra, vi köper samma saker som andra, surfar runt som andra och vissa saker som vi gör kan statistiskt kopplas till inkomst, var vi finns geografiskt, till kön och vad vi har gjort ute på nätet.

Ska du lansera ett nytt flugfiskespö så ökar dina chanser att få en träff, få spön sålda,  om du satsar på en man som är i rätt ålder, med rätt inkomst och som bor på rätt plats. Statistiskt.

Ska du lansera en exklusiv bil så handlar det om pengar och då är det ingen större idé att satsa på reklam till områden med en låg medelinkomst – inte till konsumenter som inte har något som helst intresse av bilar heller.

Ska du lansera en längre utbildning så sikta inte på att skicka reklam till mottagare i pensionsåldern – och så vidare, du fattar?

Därför är det oerhört mycket effektivare, snabbare och träffsäkrare att samla in viss datapunkter, sammanställa dem för att sedan skicka riktad reklam. I det här fallet skulle det kunna vara:

  • Rätt ålder
  • Rätt inkomst
  • Rätt boende, geografiskt
  • Rätt utbildning
  • Rätt intressen
  • Rätt beteende ute på nätet

Räkna inte heller in enbart det som görs på nätet. Datatrålarna har samarbetspartners, webbplatser, e-butiker och tjänster som samlar in data om dig och som sedan skickar informationen till Meta, Google med flera.

Din iPhone avlyssnar dig inte därför att den inte måste göra det – inte för att pricka in vad du kan antas vara intresserad av eller för att skicka riktad reklam till dig. Det finns enklare och effektivare sätt.

Detta är Facebook Pixel och därför vet den sociala jätten ALLT om dig

Detta är Facebook Pixel och därför vet den sociala jätten ALLT om dig

television showing man using binoculars

Det finns cookies, kakor, som lagras på din dator när du besöker en webbplats. Ursprungligen är kakkor avsedda för att lagra lit information om dig som användare så att webbplatsen vet vilka tekniska inställningar dina prylar har – så används cookies här på Magasin Macken exempelvis. Sen finns en rad olika spårningsverktyg – däribland Facebook Pixels, eller Meta Pixels som lösningen nu heter.

Det är verktyget som gör att den sociala jätten vet praktiskt taget allt om dig.

Du söker efter en bilverkstad och börjar att att besöka generalagenten, importen av just ditt bilmärke för att se om de rekommenderar några speciella verkstäder. Det gör de nu inte så du gör en sökning på nätet för att se vad det kostar i genomsnitt för att byta bromsbelägg för att se om det kan löna sig att göra det själv. Du inser att det är rätt komplicerat så du säker vidare och hittar en verkstad, auktoriserad, i närheten.

Du skickar in en fråga till verkstaden för att få ett pris på byte av bromsbelägg – vilket landar i din inkorg någon dag senare.

Då det inte är någon panik med bytet av bromsbelägg så stannar du där, tillsvidare.

Reklam

Kort efter dina sökningar så möts du av reklam för byte av bromsar, verkstäder och bilreklam. Frågan är då hur detta har gått till – avslyssnas du av din telefon?

Förklaringen är enklare än så – hemsidan för ditt bilmärke använder Facebook Pixels, liksom verkstan och flera av de webbplatser där du kollar in priserna för bromsbelägg. Facebook vet nu vilken bilmodell du kör, att det snart är dags att byta bromsar, var du bor, din e-postadress och ditt telefonummer. De senare uppgifterna lämnade du hos verkstan. Facebook vet också vilken dator, vilket operativsystem du använder, var du kopplat upp dig, vilken operatör du är abonnent hos och hur länge du har besökt varje enskild webbplats.

Därför vet också Facebook att du sannolikt för mottaglig för annonser rörande bilreparationer.

Nästa exempel

Tycker du att detta inte spelar någon roll, att du inte har något att dölja och att det inte spelar någon roll?

Häng med i nästa exempel då, som inte är något påhitt utan som bygger på vad som faktiskt har inträffat.

Du loggar in på Apotekets webbplats och söker efter information om ett problem i de undre regionerna – och du har loggat in då det är ”ditt” apotek. Nu vet Facebook att du har ett underlivsproblem, din e-postadress, telefonnummer, bostadsadress och din eventuella sjukdom kana alltså direkt knytas till dig som enskild invid. Detta har inträffat vid ett flertal tillfällen – i Sverige – att sjukhus, vårdcentraler och apotek har använt sig av Meta Pixel – och som har skickat mycket känslig information till Facebook.

Problemet

Problemet är inte så mycket vad en enskild webbplats samlar in utan att meta Pixel används av så många olika webbplatser och att all information skickas till Facebook. Den sociala mediajätten har tillgång till enorma mängder data, som samlas in automatiskt och därför behöver inte Meta, Facebook, Google, Twitter eller TikTok avlyssna vare sig dig ellr din telefon. De kan samla in all den information de behöver ändå.

Använder du Google Chrome så slår du ut allt Apples skydd av din information

Använder du Google Chrome så slår du ut allt Apples skydd av din information

Använder du Google Chrome som webbläsare slår du samtidigt alla skydd, allt det skydd Apple har som standard för att skydda dig och din information.

Jag har skrivit otaliga texter om Google, Google Chrome och sökjättens alla olika tekniska lösningar för att kartlägga och samla in information om oss.

Här är Mackens Guide för att komma undan Facebook, Google och andra datatrålare

Ovan det så är Google Chrome en resursgris som drar mer ström (förkortar batteritiden), använder med RAM-minne och som körer mer reser av din Mac.

Google Chrome är fortfarande en resursgris

AppleInsider har skrivit en utmärkt artikel om varför du inte ska använda Google Chrome och slutsatsen är enkelt – du tror att du surfar runt på nätet när det i själva verket är Google som surfar runt och titta på allt det du gör.

ContraChrome

Oddly, however, many Mac users still opt to defeat most of these efforts when they choose to run Google’s Chrome browser rather than the default Safari or other privacy-centric browsers. Although Chrome for Mac has to abide by some of Apple’s privacy rules, which make it somewhat better than the versions of Chrome for other platforms, it is still best characterized as a data miner disguised as a web browser.

Apple

Har du valt Apple som plattform, macOS för att Apple skyddar din information med en rad åtgärder så bör du alltså veta att alla dessa skydd rundas av Google med Google Chrome. De skydd Apple har installerade och aktiva som standard – som skyddar dig om du använder Brave, Safari eller Firefox är inte i närheten av att vara lika effektiva om du använder Google Chrome.

Förklaringen är enkel – Googles bärande affärsidé är att samla in information om det vi gör på nätet. Därför gör deras webbläsare det, deras dokumenthantering, deras bildlagring och deras sökmotor. Alla Googles tjänster bönar ett syfta – kartlägga dig, mig och alla andra.

Det finns en sak du kan börja med för att ta tillbaka kontrollen över dig, dina enheter och din information:

Kasta ut Google!