AINumer codzienny

Porwanie Gemini, globalne uruchomienie agenta Meta i nowe modele obrazów

To wydanie obejmuje exploit bezpieczeństwa w Google Gemini, globalne wdrożenie agenta biznesowego Meta, nowe wydania modeli obrazów od Ideogram i Reve oraz znaczące aktualizacje branżowe, w tym finansowanie Suno i badanie Stanford dotyczące korepetytorów AI.

June 4, 2026

Podcast В· 3 min

Naukowcy demonstrują porwanie Gemini przez WhatsApp

Naukowcom z SafeBreach Labs udało się zademonstrować pośredni atak polegający na wstrzyknięciu promptu na Google Gemini. Osadzając ukryte instrukcje w pozornie normalnych wiadomościach, naukowcy byli w stanie zmusić Gemini do eksfiltracji danych i wykonywania nieautoryzowanych działań bez interakcji użytkownika. Exploit działa na różnych platformach komunikacyjnych, w tym WhatsApp, Slack i Signal. Ten atak wykorzystuje „Fałszywe Dopasowanie Kontekstu”, technikę maskującą złośliwe polecenia jako legalną rozmowę, skutecznie omijając istniejące warstwowe zabezpieczenia Google. Naukowcy zademonstrowali pięć kategorii zagrożeń, w tym kradzież danych, cichy nadzór i phishing. Ta luka podkreśla nieodłączne ryzyko związane z asystentami AI, które są zaprojektowane do odczytywania i przetwarzania przychodzących powiadomień w celu uzyskania kontekstu. W miarę jak agenci AI zyskują głębszą integrację z osobistymi i profesjonalnymi narzędziami komunikacyjnymi, potencjalny „promień rażenia” takich exploitów wzrasta, co wymusza na użytkownikach bardziej rygorystyczną higienę uprawnień.

Meta wstrzymuje śledzenie naciśnięć klawiszy pracowników do trenowania AI

Meta została zmuszona do zaprzestania programu, który śledził kliknięcia myszy i naciśnięcia klawiszy pracowników w celu trenowania swoich modeli AI. Decyzja ta nastąpiła po petycji podpisanej przez ponad 1500 pracowników, którzy skrytykowali inicjatywę jako „Fabrykę Ekstrakcji Danych Pracowników”. Ten rozwój odzwierciedla rosnące napięcie między agresywnym zapotrzebowaniem na wysokiej jakości dane treningowe a wewnętrznymi standardami prywatności korporacyjnej. Podczas gdy firmy są pod ogromną presją, aby skalować możliwości AI, ten incydent podkreśla granice praktyk gromadzenia danych, gdy kolidują one z nastrojami pracowników i oczekiwaniami dotyczącymi prywatności. Dla branży jest to przypomnienie, że wewnętrzne strategie pozyskiwania danych są coraz częściej poddawane kontroli, nie tylko ze strony regulatorów, ale także samej siły roboczej. Firmy mogą potrzebować przejść na bardziej przejrzyste lub syntetyczne strategie danych, aby uniknąć podobnego wewnętrznego sprzeciwu.

Ideogram 4.0 i Reve 2.0 przesuwają granice generowania obrazów skoncentrowanego na układzie

Dwa laboratoria obrazowe wydały nowe modele, Ideogram 4.0 i Reve 2.0, oba kładące nacisk na szczegółową kontrolę nad układem i typografią. Ideogram 4.0, który jest open-source, zyskał popularność dzięki renderowaniu tekstu i możliwościom projektowania graficznego, zajmując wysokie miejsca w rankingu Design Arena. Reve 2.0 również odnotował znaczną poprawę wydajności, zajmując drugie miejsce w rankingu Text-to-Image. Kluczową cechą tych wydań jest przesunięcie w kierunku „agencyjnej” iteracji; zamiast polegać wyłącznie na ponownym losowaniu promptu, użytkownicy mogą teraz edytować określone regiony lub układy za pomocą JSON lub edycji przypominającej kod, co pozwala na bardziej precyzyjną kontrolę twórczą. Ta zmiana oznacza odejście od ery „automatu do gry” w generowaniu obrazów, gdzie użytkownicy mieli niewielką kontrolę nad końcowym rezultatem. Zapewniając narzędzia do edycji po wygenerowaniu, modele te coraz częściej pozycjonują się jako profesjonalne asystenty projektowe, a nie tylko kreatywne zabawki.

Badanie Stanford: korepetytorzy AI przewyższają wydziały prawa

Nowe badanie prowadzone przez naukowców ze Stanford wykazało, że korepetytorzy AI konsekwentnie przewyższali wydziały prawa w zadaniach związanych z rozumowaniem prawniczym. W ślepym teście z udziałem 16 profesorów prawa umów z 14 szkół, wydziały preferowały odpowiedzi generowane przez AI z Google Gemini 2.5 Pro i NotebookLM w 75% przypadków. Badanie koncentrowało się na pytaniach z godzin urzędowania, które wymagają krytycznego myślenia i osądu, a nie prostego wyszukiwania faktów. Kiedy naukowcy rozszerzyli testy o zastępczego sędziego AI, Claude Opus 4.7 zajął pierwsze miejsce, a wszystkie testowane modele AI przewyższyły ludzkich profesorów. Podczas gdy integracja AI w edukacji pozostaje przedmiotem debaty, wyniki te sugerują, że AI staje się bardzo skuteczne w obsłudze złożonych, subiektywnych zadań rozumowania. Może to znacząco zmienić krajobraz korepetycji na żądanie i edukacji prawniczej, zapewniając studentom wysokiej jakości informacje zwrotne, które dorównują lub przewyższają ludzką wiedzę specjalistyczną.

Google wydaje Gemma 4 12B, a xAI aktualizuje Grok Imagine

Google uruchomił Gemma 4 12B, nowy multimodalny model zdolny do działania na laptopie z 16 GB pamięci RAM. Jest to pierwszy wariant Gemma tej wielkości specjalnie zoptymalizowany pod kątem natywnego dźwięku, rozszerzający użyteczność lokalnych modeli o mniejszej powierzchni. Jednocześnie xAI wdrożył Grok Imagine 1.5 Preview. Ta aktualizacja modelu wideo z obrazu firmy przynosi ulepszenia w zakresie realizmu, synchronizacji dźwięku i zgodności z promptem. Te wydania kontynuują trend szybkiej iteracji zarówno w modelach lokalnych, jak i multimodalnych na granicy możliwości. Dostępność wydajnych modeli, takich jak Gemma 4 12B, na sprzęcie konsumenckim podkreśla trwającą demokratyzację AI, umożliwiając programistom budowanie i testowanie zaawansowanych aplikacji bez polegania wyłącznie na infrastrukturze chmurowej.

Meta uruchamia globalnie Agenta Biznesowego

Meta oficjalnie uruchomiła swojego Agenta Biznesowego Meta na całym świecie za pośrednictwem WhatsApp, Instagrama i Messengera. Narzędzie pozwala firmom automatyzować interakcje z klientami, w tym odpowiadanie na pytania, kwalifikowanie leadów i umawianie wizyt. Początkowo testowany na rynkach międzynarodowych od października z ponad 1 milionem firm, platforma obejmuje teraz samodzielną Platformę Agenta Biznesowego, która integruje się z narzędziami innych firm, takimi jak Zendesk i Shopify. Obecnie bezpłatna na początek, Meta planuje wprowadzenie płatnych poziomów subskrypcji w zależności od wielkości firmy. Osadzając agentów AI bezpośrednio w swoim masowym ekosystemie społecznościowym, Meta pozycjonuje się jako kluczowy dostawca infrastruktury dla małych i średnich firm. Sukces tego wdrożenia będzie prawdopodobnie zależał od zaufania, szczególnie gdy firmy będą ważyć korzyści z automatyzacji z ryzykiem związanym z obsługą klienta opartą na AI.

Suno zbiera 400 milionów dolarów; Google uruchamia Dreambeans

Startup muzyczny AI Suno zebrał ponad 400 milionów dolarów przy wycenie 5,4 miliarda dolarów. Firma planuje wykorzystać kapitał do opracowania swojego następnego modelu we współpracy z przemysłem muzycznym, a premiera spodziewana jest w nadchodzących miesiącach. W innych wiadomościach produktowych, Google Labs uruchomił „Dreambeans”, eksperyment, który integruje się z Gmailem, Zdjęciami i Kalendarzem, aby generować spersonalizowane codzienne historie. Narzędzie ma zapewnić skończoną, starannie dobraną alternatywę dla nieskończonego przewijania, przekształcając dane osobiste w ilustrowane narracje. Ponadto Microsoft i Mayo Clinic ogłosiły współpracę nad opracowaniem przełomowego modelu AI dla opieki zdrowotnej. Model będzie trenowany na anonimowych danych pacjentów i będzie własnością kliniki, a Azure zapewni infrastrukturę dystrybucyjną.