Roboty ante portas
Materiały fizyczne nadal trzeba przenosić z punktu A do punktu B. I to właśnie roboty będą to robić.
Hannibal ante portas (łac. Hannibal u bram) – łacińska sentencja ostrzegająca przed nadchodzącym niebezpieczeństwem, pierwotnie okrzyk trwogi Rzymian po klęsce z Kartaginą w bitwie pod Kannami (216 p.n.e.)[1].
Świat technologii obsesyjnie skupia się na kolejnych przełomach w modelach językowych. Tymczasem cicha rewolucja dokonuje się w sektorze, który może ostatecznie wywrzeć większy wpływ na gospodarkę światową: robotyka. Według eksperta z tej dziedziny, Ryana Juliana, roboty to “najwyższy kapitał dobra”. Są to maszyny zaprojektowane do mnożenia ludzkiej produktywności w skali jakiej jeszcze nie widzieliśmy - a być może widzieliśmy, ale nie pamiętamy,bo skala będzie porównywalna do zamiany wozów z węglem ciągniętych przez konie na pociągi parowe, liczące kilkanaście wielotonowych wagonów.
Liczby nie kłamią: 10-12% światowej gospodarki stanowi logistyka, a kolejne 15-20% to produkcja. To łącznie około jednej trzeciej globalnej aktywności ekonomicznej. Są to sektory, gdzie roboty mogą potencjalnie zastąpić lub znacznie wspomóc ludzką pracę. W przeciwieństwie do wielkich modeli językowych, które zmieniają sposób pracy z informacjami, roboty mają potencjał przekształcenia sposobu, w jaki fizycznie wytwarzamy i przemieszczamy wszystko, od samochodów po przesyłki.
Dane demograficzne dodają pilności tej transformacji. Spadające wskaźniki urodzeń w krajach rozwiniętych tworzą fundamentalny problem: jak zapewnić siłę roboczą społeczeństwom z kurczącą się populacją w wieku produkcyjnym? Roboty oferują jedyne skalowalne rozwiązanie.
Przez dziesięciolecia robotyka wymagała armii doktorów nauk, którzy przez lata tworzyli wysoce wyspecjalizowane systemy dla pojedynczych zadań. Dzisiaj nastąpił zwrot: programowanie robotów przekształca się z problemu inżynierskiego w problem sztucznej inteligencji i danych.
Wizja jest oszałamiająca: robot, który już wie, jak parzyć kawę, sortować rzeczy w magazynie i sprzątać po dzieciach, może nauczyć się składać meble IKEA, których nigdy wcześniej nie widział. Na naszych oczach, wspólnym wysiłkiem badaczy z wielu krajów, rodzi się “ChatGPT robotyki”, model podstawowy, który może uczyć się nowych zadań z minimalną ilością danych treningowych.
Kluczowe różnice między obecnym podejściem a przyszłością:
Dawniej: Zatrudnij zespół doktorów nauk na lata, stwórz system jednozadaniowy
Teraz: Zbierz dane, wytrenuj model, uzyskaj system wielozadaniowy
Istnieje jednak fundamentalna pułapka. Modele językowe trenują na miliardach przykładów tekstu z internetu. Najbardziej zaawansowane modele robotyczne trenują na dziesiątkach tysięcy przykładów, wymagających heroicznych wysiłków dziesiątek lub setek ludzi. Nie ma “internetu danych robotycznych”.
To tworzy klasyczny problem kurczaka i jajka: potrzebujesz dobrego systemu, aby zebrać dane, ale potrzebujesz danych, aby stworzyć dobry system. Jak można to rozwiązać?
1. Transfer wiedzy z modeli językowych - badania pokazują, że roboty mogą przenieść wiedzę z cyfrowego świata do fizycznego. Robot, który nigdy nie widział dinozaura, ale uczył się podnosić przedmioty, może odebrać polecenie “podnieś dinozaura” dzięki wcześniejszej wiedzy o tym, jak wyglądają dinozaury.
2. Symulacja - te imponujące filmy z chińskimi robotami wykonującymi akrobacje? Większość tego treningu odbywała się w symulacji komputerowej. Nawet 99% nauki chodzenia może odbywać się w wirtualnym świecie.
3. Strategia “weź pieniądze i zasyp nimi problem” - obecny złoty standard: zbuduj setki lub tysiące robotów, rozmieść je w prawdziwych miejscach pracy, płać ludziom za zdalne sterowanie nimi a na końcu zbieraj dane. Wygląda prosto, ale jest bardzo kosztowne. Zaleta? Da się po jakimś czasie (i wydaniu olbrzymich sum) osiągnąć ten magiczny punkt, w którym model staje się wystarczająco duży i użyteczny.
Analiza Juliana ujawnia fascynujące różnice w podejściu:
Badania naukowe - jeszcze w 2017-2021 roku, prace z chińskich laboratoriów rzadko zasługiwały na uwagę. Dzisiaj Julian musi “uważnie przeczytać tytuł i abstrakt” każdej pracy z Chin, a “dużą część z nich zapisuje, bo musi przeczytać dokładnie.”
Przemysł - Chiny koncentrują się na produkcji sprzętu w skali. Sukces mierzy się liczbą wyprodukowanych robotów. Unitree — pokazowy przykład tej strategii — wziął open-source’owy projekt MIT Cheetah i udoskonalił go do produkcji masowej.
USA/Zachód - skupia się na przełomach i własnościowej sztucznej inteligencji. Wartość leży w danych, oprogramowaniu i inteligencji, nie w fizycznych maszynach.
To tworzy interesującą dychotomię: Chiny budują najlepsze “ciała” robotów, Zachód buduje najlepsze “mózgi”. Jeśli roboty kiedykolwiek będą miały religię, wyznawały będą osobnych twórców umysłu i ciała.
Julian przedstawia interesującą analizę rozwoju w czasie:
Następne 3-5 lat: Pilotażowe programy w logistyce, obsłudze materiałów i lekkiej produkcji. Roboty będą głównie przemieszczać rzeczy, czyli podnosić i układać. To brzmi prosto, ale stanowi ogromną część gospodarki. Od starożytności handel to w praktyce przenoszenie różnych dóbr z miejsca na miejsce.
7-10 lat: Przy założeniu sukcesu pierwszej fazy, bardziej skomplikowane zadania produkcyjne. Montaż elementów, instalacja okablowania, podstawowe zadania domowe jak ładowanie zmywarki.
10+ lat: Zadania wymagające wysokiego poziomu bezpieczeństwa i zaufania, takich jak opieka zdrowotna, usługi osobiste, opieka nad dziećmi.
Kluczowe różnice w czasie wdrożenia:
Przemysłowe zastosowania: “To już przesądzone”
Roboty domowe: Wymagają “o rzędy wielkości więcej inteligencji”
Liczby robią wrażenie już teraz. Ponad połowa pracy w fabrykach samochodów to logistyka i dostarczanie materiałów. W epoce masowej personalizacji (każdy samochód ma inne specyfikacje), ta praca staje się tylko bardziej złożona.
Zawsze czujni bezduszni
Roboty to tacy pracownicy, którzy:
Pracują 24/7 bez przerw, weekendów i świąt
Nie chorują i nie wymagają urlopów
Skalują się w górę i w dół według zapotrzebowania, bez konsekwencji dla zdrowia czy psychiki
Bez ryzyka pracują w niebezpiecznych środowiskach
To nie “tylko” automatyzacja, ale transformacja całych sektorów gospodarki.
Bez wgrania zapisów
Julian podkreśla krytyczne wyzwanie: fizyka jest bezlitosna. W przeciwieństwie do cyfrowego świata, gdzie można cofnąć każdą akcję, fizyczne błędy robotów są nieodwracalne. Gdy robot stłucze kubek, wprowadził nieodwracalną zmianę w świecie.
Dodatkowo, różnorodność danych jest ważniejsza niż ich skala. Miliony demonstracji tego samego zadania w tym samym miejscu nie pomogą systemowi się uczyć. Potrzeba wielu różnych scenariuszy, co jest najdroższym możliwym sposobem organizacji zbierania danych.
Rewolucja robotyczna nie będzie wyglądać jak w filmach sci-fi. Będzie bardziej przypominać rewolucję przemysłową czyli stopniową, ale dogłębną transformację tego, jak funkcjonuje praca i produkcja.
Kluczowe przewidywania:
Pierwsze wdrożenia w przemyśle w ciągu 3-5 lat
Chiny będą dominować w produkcji sprzętu
Zachód może utrzymać przewagę w AI/software
Roboty domowe to perspektywa 10+ lat
Transformacja gospodarki jest nieunikniona
Jak podsumowuje Julian: “To jest pytanie kiedy, a nie czy.” Gdy lud Rzymu krzyczał “Hannibal ante portas”, był to okrzyk trwogi i rozpaczy. Dla nas dzisiaj, być może najlepszą możliwą odpowiedzią na hasło “Roboty ante portas” jest otwarcie im bram tak szeroko, jak to możliwe.
Społeczeństwa, które opanują robotykę, będą cieszyć się wyższą produktywnością pracy i niższymi kosztami. Te, które tego nie zrobią, zostaną w tyle.
Artur Kurasiński
Fajny tekst? Chcesz mnie wesprzeć w tworzeniu kolejnych?
CZYM JEST OPENCLAW? 🦀
Interent zwariował na punkcie OpenClaw. Co to jest, co to może zrobić? Poniżej krótkie wyjaśnienie będące podsumowanie wywiadu z Peterem Steinbergerem (twórcą OpenClaw) w ramach rozmów z cyklu Y Combinator…
Ok, to czym jest OpenClaw?
OpenClaw to open-source’owy asystent AI, który stał się viralem — działa lokalnie na Twoim urządzeniu, łączy się z komunikatorami, z których już korzystasz, i nie ogranicza się do rozmowy. Naprawdę wykonuje zadania: zarządza mailem, kalendarzem, plikami, workflowami i innymi elementami Twojego cyfrowego życia…
OpenClaw to system, który:
ma dostęp do Twoich plików,
może sterować myszą i klawiaturą,
wykonuje operacje systemowe,
korzysta z CLI (narzędzi uniksowych),
zarządza pamięcią w postaci lokalnych plików Markdown,
działa jak „cyfrowy duch” na Twoim komputerze.
Agent ma dokładnie te same możliwości co użytkownik – jeśli Ty możesz coś zrobić na komputerze, on też może (co oznacza ogromne zagrożenie jeśli naprawdę dasz dostęp do swoich social mediów, skrzynki mailowej czy innych ważnych plików) .
Repozytorium projektu zdobyło ponad 160 tys. gwiazdek na GitHubie w krótkim czasie, a wokół projektu zaczęła powstawać społeczność budująca kolejne zastosowania – w tym systemy bot-to-bot oraz boty wynajmujące ludzi do zadań w świecie fizycznym.
Jak działa OpenClaw?
Większość agentów AI działa w modelu cloud-based. OpenClaw działa bezpośrednio na Twoim komputerze, co oznacza:
pełny dostęp do lokalnych danych,
brak zamknięcia w silosie konkretnej firmy,
pełną kontrolę nad pamięcią i historią.
Pamięć agenta to po prostu pliki .md przechowywane lokalnie – użytkownik je posiada i kontroluje.
Agent jako „przyjaciel”, nie aplikacja
Nie korzystasz z niego jak z aplikacji. Nie myślisz o:
folderach,
modelach,
sesjach,
kontekstach.
Po prostu rozmawiasz z nim, a on:
podejmuje decyzje,
wyszukuje dane,
analizuje pliki,
używa narzędzi systemowych,
instaluje zależności,
wywołuje API,
rozwiązuje problemy.
Przykłady wykorzystania OpenClaw?
agent używa CLI,
wywołuje API,
przetwarza pliki,
uruchamia skrypty,
tworzy raporty,
aktualizuje arkusze,
publikuje treści,
przeglądać maila i oznaczać realnie ważne wątki,
tworzyć podsumowania tygodnia,
przygotowywać drafty odpowiedzi,
łączyć informacje z różnych plików i notatek,
przygotowywać briefing przed spotkaniem na podstawie historii kontaktu
Zalety używania OpenClaw?
Brak silosu danych
Pamięć należy do użytkownika.Unix + CLI zamiast sztucznych protokołów
Zamiast wymyślać specjalne interfejsy dla AI, OpenClaw używa narzędzi, które już działają (CLI).Brak zależności od jednego modelu
Model jest wymienialny – „mózg jest swapowalny” (wiem, okropne słowo ;)Charakter i tożsamość agenta
Twórca wspomina o plikusoul.md– zestawie wartości i tożsamości, które wpływają na styl odpowiedzi i interakcję.
ŹLE SIĘ DZIEJE W POLSKIEJ NAUCE
Zapraszm na wywiad z prof. Piotrem Sankowski – doktorem habilitowany nauk matematycznych oraz dyrektorem w IDEAS Research Institute…
Rozmawiamy o roli AI w polskiej nauce (oraz w badaniach i edukacji) oraz o tym, dlaczego naukowcy w Polsce często zarażają się “punktozą” i ile prawdy jest w powiedzeniu “czym się różni doktorant od balkonu? Balkon jest w stanie utrzymać rodzinę”?
Czego dokładnie dowiesz się w z naszej rozmowy?
Dlaczego zdaniem prof. Sankowskiego polska nauka wciąż działa według reguł z XX wieku?
Czy warto wracać do Polski z zagranicy, by robić tu karierę naukową?
Jak zbudować infrastrukturę do trenowania dużych modeli językowych w Polsce?
Czy AI może być polską specjalizacją, która pozwoli nam przebić szklany sufit rozwoju?
Kiedy AI powie „nie wiem” – i dlaczego to ważne?
ZOBACZ📺
POSŁUCHAJ🎙️
NEWSY WARTE TWOJEJ UWAGI:
Przeszukałem internet w poszukiwaniu najciekawszych/najważniejszych historii dotyczących technologii:
REKLAMA AUDIO LEPSZE W PODCASTACH NIŻ NA YT
Badanie Podscribe i Oxford Road pokazuje, że reklamy audio w podcastach są skuteczniejsze sprzedażowo niż ich wideoodpowiedniki na YouTube. Reklamodawcy mogą tracić nawet 250 000 dolarów na milionie wydanym na wideo zamiast audio.
OPENAI TESTUJE REKLAMY W CHATGPT
OpenAI rozpoczęło testy reklam w darmowej wersji ChatGPT w USA, które pojawiają się pod odpowiedziami bota i są wyraźnie oznaczone. Celem jest zwiększenie przychodów bez wpływu na jakość generowanych treści.
SZEF CISA UDOSTĘPNIŁ WRAŻLIWE DANE W CHATGPT
Madhu Gottumukkala, tymczasowy szef CISA, wprowadził do publicznej wersji ChatGPT niejawne dokumenty rządowe oznaczone jako „tylko do użytku służbowego”. Choć dane nie były sklasyfikowane, incydent wywołał alarmy bezpieczeństwa i wewnętrzne dochodzenie w DHS.
MOLTBOT: ZAGROŻENIE DLA BEZPIECZEŃSTWA USERÓW
Popularny asystent AI Moltbot, wcześniej znany jako Clawdbot, budzi obawy ekspertów przez łatwy dostęp do kont użytkowników i częste błędy konfiguracji. Pomimo szybkiego wzrostu popularności, narzędzie może prowadzić do poważnych wycieków danych.
TESLA ŻEGNA MODEL S I X (ALE WITA ROBOTY)
Tesla kończy produkcję swoich luksusowych modeli S i X, by skupić się na robotyce i rozwoju humanoidalnego robota Optimus. Decyzja oznacza strategiczne odejście firmy od klasycznych aut elektrycznych.
SNAP WYODRĘBNIA FIRMĘ DO PRODUKCJI OKULARÓW AR
Snap przekształca projekt Spectacles w osobną firmę Specs Inc., by skupić się na rozwoju okularów AR z AI, tłumaczeniem w locie i rozpoznawaniem gestów. Nowa struktura ma przyspieszyć rozwój i przyciągnąć inwestorów.
PRZYSZŁOŚĆ LLMÓW TO LOKALNE URZĄDZENIE
Nowe modele językowe mogą działać w czasie rzeczywistym bez chmury – bezpieczniej, szybciej i taniej. Artykuł podsumowuje postępy w kompresji, optymalizacji i wdrażaniu LLM bezpośrednio na urządzeniach mobilnych.
TESLA PORZUCA MOTORYZACJĘ
Tesla ogłasza koniec Modelu S i X oraz rezygnuje z planów nowych aut masowych, stawiając wszystko na robotaksówki i robotykę. Artykuł ocenia ten zwrot jako ryzykowny i potencjalnie zgubny dla dotychczasowej dominacji firmy w branży EV.
OPENAI NA MINUSIE?
Analiza Epoch i Exponential View pokazuje, że mimo wysokich marż brutto, OpenAI nie pokrywa pełnych kosztów R&D modeli takich jak GPT‑5. Firma działa na granicy opłacalności, licząc na przyszłe zyski skali.
APPLE MA WŁASNĄ GRĘ W AI
Apple nie goni konkurencji w wyścigu na duże modele, lecz stawia na działanie AI lokalnie na urządzeniach. Taka strategia może dać przewagę w prywatności i efektywności kosztowej.


