{"vars":{{"pageTitle":"Wydawcy kontra sztuczna inteligencja. Największe portale informacyjne masowo blokują boty AI","pagePostType":"post","pagePostType2":"single-post","pageCategory":["news"],"pageAttributes":["badania-nad-sztuczna-inteligencja","chatboty","chatgpt","google","google-bard","main","najnowsze","portale-informacyjne","sztuczna-inteligencja"],"pagePostAuthor":"Filip Majewski","pagePostDate":"7 marca 2024","pagePostDateYear":"2024","pagePostDateMonth":"03","pagePostDateDay":"07","postCountOnPage":1,"postCountTotal":1,"postID":687974}} }
300Gospodarka.pl

Wydawcy kontra sztuczna inteligencja. Największe portale informacyjne masowo blokują boty AI

Większość stron informacyjnych automatycznie blokuje boty internetowe od OpenAI i Google’a, wynika z raportu Reuters Institute Digital News. Utrudnia to ulepszanie chatbotów przez obie firmy oraz pozyskiwanie danych do szkolenia ich modeli językowych sztucznej inteligencji. Ale z drugiej strony zabezpiecza interesy wydawców. 

Z danych zebranych przez autorów raportu wynika, że pod koniec 2023 roku 48 proc. najczęściej odwiedzanych stron blokowało boty OpenAI, czyli od właściciela ChatGPT, jednego z najbardziej popularnych modeli językowych sztucznej inteligencji. Okoł 24 proc. portali zablokowało boty Google, który zbiera za ich pomocą dane na użytek swojego GeminiAI.

Raport stwierdza, że w blokadach przodowały portale amerykańskie i niemieckie. Tylko ok. 7 proc. polskich portali zdecydowało się na taki ruch.

Boty na usługach AI

O co chodzi? Autorzy raportu tłumaczą, że OpenAI oraz Google wykorzystują boty do zbierania danych ze stron internetowych, aby szkolić swoje modele językowe. Przeszukują one automatycznie internet, zbierając dane, wykorzystywane potem w czatach.

Jednak z różnych powodów największe portale informacyjne takie jak New York Times, The Guardian czy Washington Post, nie chcą, aby ich treści były wykorzystywane przez firmy do szkolenia AI. Uważają, że powinni oni otrzymywać rekompensatę finansową za wykorzystanie swoich treści w szkoleniu modeli AI.


Czytaj także: Oto największe zagrożenie dla światowej gospodarki. Sztuczna inteligencja ma w tym udział


Wydawcy nie chcą tracić wiarygodności

Głównym powodem takiego podejścia jest też ryzyko, na jakie narażeni są wydawcy. Jeżeli internauci korzystający z narzędzi sztucznej inteligencji, natkną się na fake newsa podanego im przez AI, które to jako źródło przypisze któregoś z większych wydawców, cała fala krytyki spada właśnie na nich. A to może wiązać się z utratą wiarygodności i spadkiem ruchu na portalach.

Wydawcy mają możliwość zablokowania botów internetowych firm AI, jeśli nie chcą, aby miały dostęp do ich treści online. Mogą to zrobić poprzez użycie pliku robots.txt na swojej stronie internetowej, który instruuje boty internetowe, aby przysłowiowo „trzymały się z dala”. Twórcy chatbotów już zareagowali na takie działania. OpenAI już 7 sierpnia 2023 roku udostępnili instrukcje, jak takie boty można zablokować, podobnie jak Google pod koniec września 2023 roku.

Originality.ai, firma zajmująca się sprawdzaniem plagiatów, śledzi tysiące najpopularniejszych stron internetowych na świecie, które blokują boty internetowe, korzystając z Wayback Machine. Jest to cyfrowe archiwum światowego internetu gromadzące kopie (snapshots) adresów i stron www przeskanowanych przez oprogramowanie Google sprzed wielu lat. Według badań Originality.ai, około 48 proc. najpopularniejszych stron informacyjnych blokuje OpenAI, około 20 proc. blokuje Common Crawl, a co czwarty portal blokuje boty Google.

Kto blokuje sztuczną inteligencję

Odsetek stron informacyjnych blokujących boty OpenAI różnił się znacznie w zależności od kraju, wahając się od 79 proc. w USA do zaledwie 20 proc. w Meksyku i Polsce. W przypadku Google’a, odsetek stron blokujących ich bota wynosił od 60 proc. w Niemczech i do 7 proc. w Polsce i Hiszpanii. Co ciekawe, wydawcy z północnej Europy byli bardziej skłonni do blokowania botów AI niż ci z południa.


Bądź na bieżąco z najważniejszymi informacjami subskrybując nasz codzienny newsletter 300Sekund! Obserwuj nas również w Wiadomościach Google.


W każdym kraju poza Niemcami, więcej stron informacyjnych blokowało boty od OpenAI niż Google’a. Ponadto prawie każda strona internetowa, która zablokowała Google AI, miała również zablokowany dostęp dla OpenAI (97 proc). Może to wynikać z faktu, że ChatGPT jest bardziej znany i szerzej stosowany niż Bard/Gemini, tym bardziej, że OpenAI jest dłużej dostępny na rynku.

Autorzy raportu zwracają uwagę, że takie działania utrudniają firmom szkolenie i ulepszanie swoich modeli AI. Z drugiej strony, portale informacyjne są w stanie zachować większą wiarygodność i unikalność swoich treści. Zmniejsza się także prawdopodobieństwo podania fake newsów przez chat boty AI i wprowadzania w błąd użytkowników, co jak wiadomo w ostatnim czasie przybiera mocno na sile.

Polecamy także: