Automaticky společnost za tím WordPress a Tumblr, jedná o zpeněžení uživatelského obsahu prodejem svých dat společnostem AI, včetně MidJourney a OpenAI. Tato data z blogovacích platforem Tumblr a WordPress.com bude použit pro školení modeAI.
Zatímco podrobnosti transakce jsou stále nejasné, tato zpráva vyvolala mezi uživateli obavy z možného zneužití jejich soukromého obsahu na dvou blogovacích platformách. 404 Media také naznačuje, že vnitřní konflikty vznikly v rámci Automattic, protože shromážděný obsah zahrnoval soukromá data, která nebyla určena k uchování v rámci společnosti.
V reakci na odpor se Automattic chystá představit novou funkci, která uživatelům umožní odhlásit se ze sdílení jejich dat pro školení AI. Společnost v příspěvku na blogu potvrzuje svůj závazek poskytovat uživatelům Tumblr a WordPress větší kontrolu nad jejich obsahem. Zmiňuje se o spuštění nastavení, které má „odrazovat od zkoumání společnostmi s umělou inteligencí“ a vysvětluje, že přední platformy pro průzkum umělé inteligence jsou ve výchozím nastavení blokovány.
Problém používání obsahu z blogů společnostmi, které vyvíjejí modele AI, se neomezuje pouze na platformy spravované společností Automattic. tak moc OpenAI jako Google používejte c-botyrawler, pomocí kterého shromažďuji informace ze všech stránek, trénovat modesoubory umělé inteligence. Proces je podobný sběru dat vyhledávači.
Jak můžete blokovat OpenAI a Gemini (Bard) berou data z vašeho blogu?
Pokud jste vlastníkem blogu nebo webu a nechcete, aby data z nich byla použita pro školení modeumělé inteligence OpenAI a Gemini, můžete blokovat roboty (crawk obsahu. Toto omezení lze nastavit pomocí souboru robots.txt
.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Po uložení souboru robots.txt s novými řádky přejděte do konzole Google a: Settings > robots.txt > klikněte na nabídku se třemi tečkami, klikněte na "Request a recrawl".
Související: GPT-5 a nový webový robot GPTBot vyvinutý společností OpenAI.
Pro uživatele Tumblr a WordPress, přístup k získávání dat z blogů od OpenAI nebo jiné společnosti zabývající se vývojem umělé inteligence, bude možné zablokovat pomocí nástrojů zpřístupněných společností Automattic.