Automaticky společnost za tím WordPress a Tumblr, jedná o zpeněžení uživatelského obsahu prodejem svých dat společnostem AI, včetně MidJourney a OpenAI. Tato data z blogovacích platforem Tumblr a WordPress.com bude sloužit k trénování modelů umělé inteligence.
Zatímco podrobnosti transakce jsou stále nejasné, tato zpráva vyvolala mezi uživateli obavy z možného zneužití jejich soukromého obsahu na dvou blogovacích platformách. 404 Media také naznačuje, že vnitřní konflikty vznikly v rámci Automattic, protože shromážděný obsah zahrnoval soukromá data, která nebyla určena k uchování v rámci společnosti.
V reakci na odpor se Automattic chystá představit novou funkci, která uživatelům umožní odhlásit se ze sdílení jejich dat pro školení AI. Společnost v příspěvku na blogu potvrzuje svůj závazek poskytovat uživatelům Tumblr a Wordstiskněte větší kontrolu nad jejich obsahem. Zmiňuje spuštění nastavení, které má „odrazovat od průzkumu společnostmi AI“, což vysvětluje, že přední platformy pro průzkum AI jsou ve výchozím nastavení blokovány.
Problém využívání obsahu z blogů společnostmi vyvíjejícími modely AI se neomezuje pouze na platformy spravované společností Automattic. tolik OpenAI Stejně jako Google používají prohledávače, které shromažďují informace ze všech webových stránek, aby trénovaly modely umělé inteligence. Proces je podobný sběru dat vyhledávači.
Jak můžete blokovat OpenAI a Gemini (Bard) berou data z vašeho blogu?
Pokud vlastníte blog nebo web a nechcete, aby se data z nich používala k trénování modelů umělé inteligence OpenAI a Gemini, můžete prohledávačům zablokovat přístup k vašemu obsahu. Toto omezení lze nastavit pomocí souboru robots.txt
.
OpenAI Crawlers
User-agent: GPTBot
Disallow: /
Gemini Crawlers
User-agent: Google-Extended
Disallow: /
Po uložení souboru robots.txt s novými řádky přejděte do konzole Google a: Settings > robots.txt > klikněte na nabídku se třemi tečkami, klikněte na "Request a recrawl".
Související: GPT-5 a nový webový robot GPTBot vyvinutý společností OpenAI.
Pro uživatele Tumblr a Wordtisku, přístup k získávání dat z blogů OpenAI nebo jiné společnosti zabývající se vývojem umělé inteligence, bude možné zablokovat pomocí nástrojů zpřístupněných společností Automattic.