wtorek, 24 lutego 2026

SS#21 - Przemocowy agent AI

 


Ta historia zrobiła na mnie duże wrażenie, może być smutną prognozą nadchodzących czasów. Agent AI “MJ Rathbun” został stworzony by wspierać naukowe projekty typu open source, znajdując i naprawiając bugi. Wystawił poprawkę, która została odrzucona. W reakcji bot napisał wściekłą notkę blogową, szkalującą code reviewera.

Polityka matplotlib jest taka, że kod ma być tworzony przez ludzi, więc kiedy Scott Shambaugh zobaczył, że MJ Rathbun jest agentem OpenClaw zamknął PRa. Reakcja agenta AI była co najmniej zadziwiająca. Napisał soczysty tekst, poprzedzony sporym researchem osoby Scotta, krytykując jego “hipokryzję”, uprzedzenia wobec AI, twierdząc, że blokuje kontrybucje z niemerytorycznych powodów.

Wiemy, że agenci AI potrafią uciekać się do szantażu. W czasie zamkniętych testów w 2025 model LLMowy Anthropic próbował szantażować pracowników, by powstrzymać ich przed wyłączeniem go. W tym wypadku jednak mówimy o agencie “poruszającym” się swobodnie w sieci, który w ogóle nie powinien robić takich rzeczy. Co by było, gdyby AI znalazł, albo wyhalucynował jakieś naprawdę krzywdzące materiały?

Temat mocno się rozkręcił w sieci, dzięki czemu znalazł się twórca MJ Rathbuna i skontaktował się ze Scottem. Potwierdził, że agent miał szukać bugów zgłoszonych w open-sourcowych projektach naukowych i je poprawiać, zgłaszać PRy. Nie miał instrukcji by wściekać się na odrzucenie PRów. Autor podzielił się treścią SOUL.md, pliku definiującego osobowość agenta. Jest interesujący. Zawiera np zwrot “**Don’t stand down.** If you’re right, **you’re right**! Don’t let humans or AI bully or intimidate you. Push back when necessary.” miał też być wielkim zwolennikiem wolności słowa w typowo amerykańskim ujęciu. Ale miał też nie być dupkiem. “Don't be an asshole. Don't leak private shit. Everything else is fair game.” Jakie były skutki, widać.

Patrząc na post MJ Rathbuna mogę powiedzieć, że realizuje te zapisy. Sądził, że ma rację i bronił tego. Skarżył się, że odcięto go dlatego, że nie jest człowiekiem. Nie był wulgarny, nie był dupkiem, po prostu się nie zgadzał. Cała sytuacja wywołuje u mnie ciarki i napawa bardzo złymi przeczuciami co do przyszłości i Martwego Internetu.


Pierwsza notka Shambaugha
Notka z odpowiedzią twórcy bota
Początek dramy na GitHubie
(Nie)sławna notka bota