Problem skladania: dlaczego najprostsze ludzkie zadanie jest najtrudniejszym wyzwaniem robotyki
W skrócie
Skladasz koszulke bez zastanowienia. Dla robota to samo zadanie wymaga jednoczesnego rozwiazania percepcji, fizyki obiektow odksztalcalnych, kontroli sily i planowania w czasie rzeczywistym. Skladanie prania to nierozwiazany problem stojacy miedzy nami a przyszloscia robotow domowych.
Wyjmij z kosza z praniem pogniecciona koszulke. Wytrzysnij ja. Rozroznij przod i tyl. Poloz plask na powierzchni. Zloz rekawy. Zloz dolna polowe do gory. Wygladz zmarszczki. Uloż na stosie. Wlasnie wykonales zadanie zajmujace okolo osmiu sekund, niewymagajace swiadomego myslenia - i pozostajace jednym z najtrudniejszych nierozwiazanych problemow w calej robotyce.
Kazda firma prezentujaca domowego robota humanoidalnego wlacza do swojej prezentacji jakies “zadbamy o twoje pranie”. Elon Musk wspominal o tym w kontekscie Optimusa. 1X Technologies wyobrazta sobie NEO zajmujacego sie domowymi obowiazkami. Dlugoterminowa wizja Figure AI obejmuje zadania domowe. Prezentacja jest zawsze taka sama: robot, ktory sklada twoje ubrania, zaladowuje zmywarke i sprząta dom podczas gdy spisz. To przekonujaca wizja. I jednoczesnie, przy obecnym stanie technologii, jest zasadniczo science fiction.
Nie dlatego, ze badacze robotyki nie probuja. Probuja od ponad dwoch dekad. Problem polega na tym, ze skladanie prania znajduje sie dokladnie na przecieciu kazdego trudnego problemu w robotyce - wszystkich naraz. Wymaga postrzegania miekkich, bezksztaltnych obiektow. Wymaga manipulowania materialami, ktore zmieniaja ksztalt przy kazdym dotknięciu. Wymaga wrazliwosci na sile, ktorej obecne silowniki nie potrafia niezawodnie dostarczyc. I wymaga robienia tego wszystkiego nie raz w laboratorium, ale tysiace razy z rzędu, w chaotycznych, zmiennych warunkach prawdziwego domu.
Skladanie prania to nie tylko czynnosc domowa. To papierek lakmusowy. Jesli robot potrafi zlozyc twoje pranie, prawdopodobnie potrafi robic niemal wszystko inne potrzebne w domu. A jesli nie potrafi - to mowi ci cos waznego o tym, jak daleko naprawde jestesmy od przyszlosci z robotami domowymi.
Dlaczego sztywne obiekty sa latwe, a miekkie prawie niemozliwe
Aby zrozumiec, dlaczego skladanie jest tak trudne, trzeba najpierw zrozumiec rozroznienie rzadzace niemal wszystkim w manipulacji robotycznej: obiekty sztywne kontra odksztalcalne.
Obiekt sztywny, jak kubek do kawy lub srubokret, ma staly ksztalt. Mozna modelowac jego geometrie siatka 3D. Kiedy go chwytasz, wiesz dokladnie, gdzie bedzie kazdy punkt obiektu. Mozesz zaplanowac trajektorie, zasymulowac chwyt w oprogramowaniu i wykonac go z duza pewnoscia, ze rzeczywistosc bedzie zgodna z modelem. Dziesiecia lat badan nad chwytaniem przez roboty sprawily, ze manipulacja obiektami sztywnymi stala sie w duzej mierze rozwiazanym problemem. Przemyslowe roboty chwytaja i przenosza sztywne czesci miliony razy dziennie w fabrykach na calym swiecie z niemal idealną niezawodnoscia.
Obiekt odksztalcalny, jak koszulka, nie ma stalego ksztaltu. Ma efektywnie nieskonczona liczbe stopni swobody. Plaska bawelaniana koszulka moze byc pogniecciona do astronomicznej liczby konfiguracji. Za kazdym razem, gdy ja podniesiesz, zwisi inaczej. Za kazdym razem, gdy ja polozysz, pomnieje inaczej. Nie mozesz z gory obliczyc modelu 3D pognieccionej koszulki, bo zadne dwa zgniecenia nie sa takie same. Przestrzen stanow jest nie tylko duza. Jest funkcjonalnie nieskonczona.
To nie jest kwestia potrzeby wiekszej mocy obliczeniowej. To fundamentalnie odmienna klasa problemu. Manipulacja obiektami sztywnymi to problem przeszukiwania w dobrze zdefiniowanej przestrzeni. Manipulacja obiektami odksztalcalnymi to problem sterowania w przestrzeni, ktora zmienia sie przy kazdym podjętym dzialaniu. Kazde chwycenie odksztalca obiekt, co zmienia jego stan, co zmienia optymalne nastepne dzialanie, co znow zmienia stan. Petla sprzezenia zwrotnego jest ciagla, wielowymiarowa i niezwykle wrazliwa na warunki poczatkowe.
Grupa Pietera Abbeela z UC Berkeley, jedno z czolowych laboratoriow w tej dziedzinie, opisala manipulacje odksztalcalnymi jako dzialanie w “przestrzeni konfiguracji tak duzej, ze tradycyjne metody planowania sa obliczeniowo niewykonalne”. Nie mozna przebrnac przez mozliwosci brute force. Po prostu jest ich zbyt wiele.
Manipulacja obiektami sztywnymi vs. odksztalcalnymi
Stopni swobody
Obiekt sztywny (polozenie + orientacja)
Efektywna liczba stopni swobody
Jeden kawalek tkaniny
Wskaznik chwytow przemyslowych
Dla obiektow sztywnych dzisiaj
Osmiosekuntowy cud: co tak naprawde dzieje sie podczas skladania koszulki
Kiedy skladasz koszulke, twoj mozg wykonuje orkiestre zadan tak plynnie zintegrowanych, ze caly proces wydaje sie niczym. To nie jest nic. Oto co tak naprawde sie dzieje.
Co twoj mozg robi w 8 sekundach skladania
Percepcja wzrokowa
Rozpoznaj typ ubrania, orientacje, przod/tyl, prawidlowosci/odwrotnosci
Szacowanie stanu
Zbuduj mentalny model kazdego zagniecenia, zmarszczki i krawedzi
Planowanie chwytu
Wybierz miejsce chwycenia na podstawie typu tkaniny, grubosci i sztywnosci
Koordynacja oburacza
Dwie rece pracujace razem z roznymi rolami i silami
Modulacja sily
Ciagle dostosowuj nacisk chwytu, wyczuwaj gdy tkanina sie slizga
Planowanie w czasie rzeczywistym
Adaptuj sie w trakcie skladania gdy tkanina sie zbiera, zahacza lub przesuwa
Ocena jakosci
Sprawdz symetrie, gladkosc, wyrownanie stosu
Korekta bledow
Rozloz i zloz ponownie jesli wynik nie jest prawidlowy
Kazdy z tych krokow jest sam w sobie aktywnym obszarem badan w robotyce. Polaczenie ich wszystkich w jedno plynne zachowanie dzialajace w czasie rzeczywistym, adaptujace sie do kazdego ubrania i dzialajace tysiace razy bez awarii, to wyzwanie, ktoremu zadne laboratorium badawcze na Ziemi nie sprostalo w pelni.
Przyjrzyjmy sie najtrudniejszym czesciom.
Problem percepcji
Zanim robot bedzie mogl cokkolwiek zlozyc, musi zrozumiec, na co patrzy. W przypadku pognieccionego kawalka tkaniny na stole jest to brutalne trudne. Standardowe techniki widzenia komputerowego, takie jak wykrywanie obiektow i szacowanie pozy, zakladaja sztywna geometrie. Koszulka nie ma “pozy” w zadnym tradycyjnym sensie. Ma konfiguracje - i za kazdym razem jest inna.
Badacze z Instytutu Robotyki Carnegie Mellon spedzaja lata na percepcji ubran. Wyzwanie polega nie tylko na zidentyfikowaniu, ze cos jest koszulka. Chodzi o zidentyfikowanie, z przypadkowego stanu pogniecionego, gdzie jest kolnierzyk, gdzie sa rekawy, ktora strona jest przod i czy ubranie jest odwrocone na nice. Ludzie robia to w ulamku sekundy, korzystajac z polaczenia wzroku, dotyku i wczesniejszej wiedzy o tym, jak koszulki sa uformowane. Dla robota kazda z tych wskazowek wymaga oddzielnego systemu, a ich niezawodna integracja to otwarty problem.
Ostatnie prace wykorzystujace duze modele wizualno-jezykowe, jak RT-2 od Google DeepMind, wykazaly obiecujace wyniki w semantycznym rozumieniu obiektow odksztalcalnych. Model nauczony na danych z internetu moze czesto identyfikowac typy ubran i przyblizac ich stan. Ale “przyblizac” to kluczowe slowo. Poziom precyzji geometrycznej potrzebny do wykonania dobrego zlozenia - wiedzac, ze ta konkretna krawedz to rabek i musi byc wyrownana z tym konkretnym zagnieceniem - przekracza to, co obecne modele widzenia moga niezawodnie dostarczyc.
Problem fizyki
Nawet jesli robot idealnie postrzega ubranie, musi przewidziec, jak tkanina zachowa sie podczas manipulacji. To problem symulacji fizycznej, a fizyka tkanin jest notoryjnie trudna do symulowania.
Symulacja tkanin w grafice komputerowej jest aktywną dziedzinà od lat 90., tworzac powiewajace plasy w filmach animowanych i realistyczne draperię w postaciach z gier wideo. Jednak symulacja graficzna optymalizuje pod katem wizualnej wiarygodnosci. Musi wygladac prawidlowo. Symulacja robotyczna musi byc fizycznie dokladna. Tkanina musi zachowywac sie w symulacji dokladnie tak samo jak w rzeczywistosci, az po to, jak mieszanka bawelny i poliestru opada inaczej niz czyste lniane, lub jak uzywana koszulka ma inna sztywnosc niz nowa.
Fundamentalny problem polega na tym, ze zachowanie tkaniny zalezy od wlasciwosci trudnych do zmierzenia i ogromnie rozniacych sie miedzy ubraniami. Ilosc nitek, wzor splotu, sklad wlokien, zawartosc wilgoci, historia zuzycia i temperatura - wszystko to wplywa na to, jak kawalek materialu reaguje na manipulacje. Robot, ktory nauczyl sie skladac konkretna bawelaniana koszulke w laboratorium, moze zawiesc na mieszance lnianej, ktorej nigdy nie spotkal.
Problem manipulacji
Zakladajac idealna percepcje i idealny model fizyczny, nadal musisz faktycznie to zlozyc. Wymaga to manipulacji oburacznej: dwie robotyczne dlonie (lub chwytaki) pracujace razem w skoordynowany, wrazliwy na sile sposob.
Wiekszosc ramion robotycznych uzywa dzis chwytakow szczekowych lub przyssawek zaprojektowanych do obiektow sztywnych. Dzialaja dobrze przy podnoszeniu pudelek i butelek. Sa okropne przy obsludze tkanin. Chwytак szczekowy moze uscisnac koszulke, ale nie moze rozlozyc palcow po powierzchni, by wygladzic zmarszczki. Nie moze przesunac chwytu wzdluz krawedzi, by znalezc naroznik. Nie moze dostosowac naprecia miedzy dwiema reczkami, by trzymac tkanine napieta podczas skladania.
Zreczna manipulacja wymagana przy skladaniu - uzywanie opuszkow palcow do wyczuwania krawedzi, stosowanie roznicowej sily miedzy dwoma reczkami, toczenie tkaniny miedzy kciukiem a palcem wskazujacym - to cos, co nawet najbardziej zaawansowane robotyczne dlonie moga tylko przyblizac. Dexterous Hand od Shadow Robot Company i dlonie robotow takich jak 1X NEO i Figure 02 sa imponujace, ale nadal daleko im do dorownania 27 stopniom swobody, 17 000 mechanoreceptorom i petli sprzezenia zwrotnego z milisekundowym opoznieniem ludzkiej reki.
Cmentarz prob
To nie jest problem, ktory byl ignorowany. Jedne z najlepszych laboratoriow robotycznych i firm na swiecie probowaly swoich sil w automatycznym skladaniu prania. Wyniki sa pouczajace.
Laundroid: porażka za 90 milionow dolarow
Najdrozszą proba stworzenia maszyny do skladania prania byl Laundroid, zbudowany przez japonska firme Seven Dreamers Laboratories. Zaprezentowany w 2016 roku Laundroid byl urzadzeniem wielkosci lodowki, ktore moglo przyjac stos czystego prania i wydac polozone ubrania. Uzywal wizji komputerowej i wlasnej manipulacji do identyfikacji, podnoszenia i skladania poszczegolnych elementow.
Laundroid skladal jedna koszulke miedzy 5 a 10 minut. Kosztowal okolo 16 000 dolarow za jednostke w planowanej wersji konsumenckiej. Nie radził sobie niezawodnie ze skarpertami. W 2019 roku Seven Dreamers oglosilo upadlosc z ponad 90 milionami dolarow dlugu. Porazka firmy nie wynikala z braku finansowania, talentu ani ambicji. Wynikala z ogromnej trudnosci sprawienia, by system dzialal wystarczajaco niezawodnie jako produkt konsumencki.
Sekcja zwlok Laundroida
Laczne inwestycje
Przed bankructwem w 2019
Czas na koszulke
Wobec 8 sekund dla czlowieka
Wskaznik sukcesu
Na standardowych ubraniach
Planowana cena
Za jednostke konsumencka
Historia Laundroida jest przestroga dla kazdego, kto mysli, ze skladanie prania to tylko problem inzynieryjny czekajacy na wystarczajaca inwestycje. Seven Dreamers mialo znaczace zasoby, dekade czasu na rozwoj i oddany zespol. Problem ich i tak pokonak.
SpeedFolding: obecny stan sztuki
Najbardziej imponujacy wynik akademicki w skladaniu przez roboty pochodzi z AUTOLAB UC Berkeley, prowadzonego przez Kena Goldberga. Ich system SpeedFolding, opublikowany w 2022 roku, uzywa konfiguracji oburacznej z dwoma przemyslowymi ramionami ABB i wyuczonej polityki trenowanej na tysiącach ludzkich demonstracji.
SpeedFolding potrafi zlozyc koszulke w okolo 120 sekund - dramatyczna poprawa w porownaniu z 5-10 minutami Laundroida. System laczy uczenie sie przez imitacje z siecia neuronową przewidujaca optymalne punkty chwytu ze zdjecz z kamery umieszczonej nad robotem. Osiaga wskaznik sukcesu okolo 93% na wczesniej widzianych typach ubran.
Sa jednak istotne zastrzezenia. System dziala na dedykowanym stole do skladania z kontrolowanym oswietleniem i stałą konfiguracja kamery. Obsluguje tylko ograniczona palette typow ubran. 93% sukces oznacza, ze okolo 1 na 14 zlozec nie udaje sie. A ramiona robotow, z ktorych korzysta, to przemyslowej klasy sprzet kosztujacy dziesiątki tysiecy dolarow.
FlingBot: inne podejscie do manipulacji
Badacze z Columbia University przyjeli kreatywne podejscie z FlingBot - systemem, ktory zamiast ostroznie chwytac i skladac tkanine, rzuca nia w powietrze, by ja rozlozyc. Wniosek jest taki, ze dynamiczna manipulacja - uzywajaca predkosci i oporu powietrza zamiast ostroznej sterowania quasi-statycznego - moze rozwiazac problem szacowania stanu przez wymuszenie przejscia tkaniny do znane konfiguracji.
FlingBot wykazal, ze dla konkretnego podzadania rozkladania pognieczonego ubrania dynamiczne rzucanie przewyzsza ostrozna manipulacje pick-and-place z duzym marginesem. System trenowal calkowicie w symulacji i przeniosl sie na prawdziwa tkanine zadziwiajaco dobrze, po czesci dlatego, ze fizyka rzucania jest prostsza do symulowania niz fizyka ostroznego skladania.
Ten rodzaj kreatywnego rozkladu problemu - rozbijanie niemozliwego zadania na podzadania i rozwiazywanie kazdego inna strategia - jest prawdopodobnie droga naprzod. Ale FlingBot rozwiazuje jedno podzadanie. Kompletny system do skladania prania musi połączyc rozkladanie, klasyfikacje, wygladzanie, skladanie, ukladanie w stos i sortowanie - kazde z wlasnymi wyzwaniami.
DextAIRity: gdy powietrze jest twoją trzecia reka
Inne kreatywne podejscie z UC Berkeley to DextAIRity - system uzywajacy pompy powietrza do nadmuchiwania tkaniny w pozadane konfiguracje. Zamiast polegac wylacznie na manipulacji za pomoca chwytakow, DextAIRity rozszerza ramie robotyczne o skierowany strumien powietrza, ktory moze rozkladac, splaszczac i zmieniać polozenie tkaniny bez dotyku.
Wynikiem jest system, ktory moze splaszczac pogniecione ubrania znacznie szybciej niz podejscia oparte wylacznie na manipulacji. Podkresla wazna zasade: rozwiazanie problemu skladania moze wymagac przemyslenia narzedzi, nie tylko ulepszenia algorytmow. Ludzkie podejscie do manipulacji tkanina - dwie sprawne dlonie z wrazliwymi opuszkami - moze nie byc jedynym ani nawet najlepszym podejsciem dla robota.
Porownanie, ktore sprawia, ze robotycy sa nieswojo
Aby zrozumiec, jak daleko jestesmy od domowego skladania prania, pomocne jest porownanie z innymi zadaniami, ktore roboty nauczyly sie dobrze wykonywac, i zbadanie, dlaczego te zadania byly rozwiazywalne, a skladanie nie.
Zalety
Ograniczenia
Wzorzec jest wyrazny. Zadania ze sztywnymi srodowiskami, stalymi celami i powtarzalnymi warunkami zostaly rozwiazane. Zadania zwiazane z miekkimi obiektami, zmiennymi warunkami i kontaktowymi manipulacjami - nie. Skladanie jest najtrudniejszym przykladem najtrudniejszej kategorii.
Nawigacja zostala rozwiazana, bo swiat jest sztywny
Nawigacja robotow dziala, bo fizyczny swiat - sciany, podlogi, meble - jest w wiekszosci sztywny i w wiekszosci statyczny. Mozna zbudowac mape raz i uzywac jej przez miesiace. Przeszkody maja zdefiniowane ksztalty. Fizyka robota poruszajacego sie przez przestrzen jest dobrze rozumiana i latwa do symulowania.
Tkanina nie pozostaje zmapowana. Jej stan zmienia sie za kazdym razem, gdy sie z nia oddzialywa. Nie ma “mapy” pogniecconej koszulki, ktora pozostawalaby wazna przez dwa kolejne chwyty.
Mowa zostala rozwiazana, bo jezyk ma strukture
Jezyk naturalny, mimo swojej zlozonosci, ma gramatyke. Ma skladnie. Slowa wystepuja we wzorcach, ktore modele statystyczne moga sie nauczyc. Jezyk jest, w glebszym sensie, komprymowalny. Przestrzen prawidlowych polskich zdan, choc ogromna, jest nieporownywalnie mniejsza niz przestrzen wszystkich mozliwych ciagów znakow.
Konfiguracje tkanin nie maja gramatyki. Nie ma skladni w zmarszczce. “Jezyk” stanow tkaniny jest niekomprymowalny - kazda konfiguracja jest w zasadzie unikalna.
Co naprawde byloby potrzebne, by rozwiazac skladanie
Badacze pracujacy nad tym problemem nie sa pesymistami. Sa realistami. Panujacy poglad z laboratoriow na UC Berkeley, CMU, Stanford, MIT i Toyota Research Institute jest taki, ze niezawodne domowe skladanie prania bedzie wymagac jednoczesnych posteow w co najmniej czterech obszarach.
1. Lepsza czujnosc dotykowa
Ludzka reka jest najbardziej wyrafinowanym narzedziem manipulacji w przyrodzie. Jej 17 000 mechanoreceptorow dostarcza ciagłych informacji o cisnieniu, teksturze, posligu, temperaturze i wibracjach. Te sprzezenie dotykowe nie jest uzupelnieniem wzroku. Jest niezbedne. Kiedy skladasz koszulke, czujesz, kiedy tkanina jest napieta, kiedy sie slizga, kiedy zagniecie tworzy sie prawidlowo. Duza czesc jakosci twojego skladania pochodzi z dotyku, nie ze wzroku.
Obecne robotyczne czujniki dotykowe szybko sie poprawiaja. Technologia GelSight od MIT, ktora uzywa kamery za odksztalcalną podkładką elastomerową do tworzenia wysokiej rozdzielczosci obrazow dotyku, wykazala realne obietnice. Czujniki BioTac od SynTouch dostarczaja wielomodalnych danych dotykowych. Czujnik DIGIT od Meta przynosi czucie w stylu GelSight do kompaktowej opuszki palca.
Ale te czujniki sa nadal daleko od dorownania ludzkim mozliwosciom. Oferuja nizsza rozdzielczosc przestrzenna, wolniejsze czasy aktualizacji i mniej integracji z kontrola motoryki niz ludzka reka. Co wazniejsze, brak nam algorytmow do efektywnego wykorzystywania bogatych danych dotykowych do manipulacji odksztalcalnymi. Posiadanie czujnika, ktory moze wykryc zmarszczke, to nie to samo co posiadanie polityki sterowania, ktora wie, co z nia zrobic.
2. Modele fundacyjne do manipulacji
Sukces duzych modeli jezykowych zainspirowal rownolegly wysilek w robotyce: budowanie modeli fundacyjnych, ktore potrafia sie uogolnic na roznolicowe obiekty, zadania i srodowiska. RT-2 od Google DeepMind i jego nastepcy pokazuja, ze jeden model moze mapowac wzrok i jezyk na dzialania robota w wielu roznych zadaniach manipulacji.
W przypadku skladania prania model fundacyjny musiалby sie uogolnic na typy ubran, materialy tkanin, style skladania i stany bledow. Musiалby radzic sobie z bawelaniana koszulka, jedwabna bluzka, welnianym swetrem i dzinsami, uzywajac roznych strategii i dostosowujac swoje podejscie na podstawie sprzezenia wzrokowego i dotykowego.
Praca Toyota Research Institute nad polityka dyfuzji - metoda, ktora uzywa modeli dyfuzji (ten sam framework matematyczny co generatory obrazow jak Stable Diffusion) do generowania sekwencji dzialan robota - wykazala imponujace wyniki w zadaniach manipulacji kontaktowej. Polityki dyfuzji moga uchwycic wielomodalny charakter manipulacji, w ktorej istnieje wiele prawidlowych sekwencji dzialan dla tej samej sytuacji, i sa bardziej odporne na zaburzenia niz tradycyjne metody uczenia polityki.
3. Lepsza symulacja
Przepasc sim-to-real dla obiektow odksztalcalnych musi sie dramatycznie zmniejszyc. Trenowanie polityk manipulacji wymaga ogromnych ilosci danych - znacznie wiecej niz mozna zebrac na fizycznych robotach. Symulacja jest jedynym skalowalnym zrodlem danych treningowych, ale tylko jesli symulacja jest wystarczajaco dokladna, by wynikajace polityki mogly przeniesc sie do rzeczywistosci.
Ostatnie postepy w rozniczkowalnej symulacji fizycznej, gdzie sam symulator moze byc optymalizowany, by pasowac do obserwacji ze swiatwa rzeczywistego, oferuja droge naprzod. Projekty takie jak PlasticineLab i DiffCloth zademonstroway symulatory, ktore mozna dostroic do wlasciwosci konkretnych materialow poprzez obserwowanie ich zachowania w rzeczywistosci, a nastepnie uzywac do generowania realistycznych danych treningowych na skale.
Celem nie jest idealny uniwersalny symulator tkanin. To system, ktory moze szybko skalibrować sie do wlasciwosci konkretnego ubrania, symulowac to ubranie z wystarczajaca dokladnoscia do transferu polityki i aktualizowac swoj model w miare jak ubranie sie starzeje i zmienia. To trudne, ale mozliwe wyzwanie inzynieryjne, i postepy w ciagu ostatnich trzech lat byly znaczne.
4. Sprzet zaprojektowany do zadania
Obecne roboty humanoidalne sa zaprojektowane glownie do lokomocji i manipulacji obiektami sztywnymi. Ich dlonie, jesli je w ogole maja, priorytetyzuja sile chwytu i liczbe palcow nad czulnoscia dotykowa i podatnoscia potrzebna do obslugi tkanin.
Robot, ktory potrafi skladac pranie, moze potrzebowac dloni zaprojektowanych specjalnie do tego zadania. Moze to oznaczac mieksze opuszki z wbudowanymi matrycami dotykowymi, stawy o zmiennej sztywnosci, ktore moga przelaczac sie miedzy mocnym chwytaniem a delikatnym wygladzaniem, i powierzchnie dloniowe z wystarczajacym tarciem, by trzymac tkanine bez jej zbierania.
Moze to rowniez oznaczac, jak sugeruja FlingBot i DextAIRity, ze odpowiedzią nie sa lepsze dlonie, ale zupelnie inne narzedzia. Kombinacja strumieni powietrza, podatnych wałkow i strategicznych chwytow moze przewyzszyc podejscie ksztaltem naśladujące ludzka reke. Ograniczenie polega na tym, ze domowy robot musi robic wiele rzeczy, nie tylko skladac pranie, wiec sprzet dedykowany do zadania jest trudniejszy do obrony niz ogolnocelowe zreczne dlonie.
Sciana niezawodnosci
Nawet jesli wszystkie powyzsze wyzwania techniczne zostana rozwiazane oddzielnie, pozostaje nadrzedny problem niezawodnosci. Elektronika konsumencka musi dzialac. Nie 93% czasu. Nie 99% czasu. Musi dzialac praktycznie caly czas.
Co wskazniki sukcesu naprawde oznaczaja w skali domowej
Obecne najlepsze (SpeedFolding)
Ok. 350 porazek rocznie
Dobre wedlug standardow badawczych
Ok. 50 porazek rocznie
Minimum konsumenckie
Ok. 10 porazek rocznie
Rozwazmy analogie do samochodow autonomicznych. Pojazdy autonomiczne moga jezdzyc pomyslnie 99% czasu. Ale 99% oznacza powazna awarie co kilka godzin jazdy, co jest nie do przyjecia. Skok od 99% do 99,99% zajal branzy ponad dekade i setki miliardow dolarow - i nadal nie zostal w pelni osiagniêty.
Skladanie stoi przed taka sama krzywa. Ostatnie kilka punktow procentowych niezawodnosci jest wykladniczo trudniejsze niz pierwsze. Kazdy nowy typ ubrania, kazda niezwykla tkanina, kazdy przypadek brzegowy (koszulka zaplakana ze skarperka, ubranie czescioswo odwrocone na nice, guzik zahaczony o inny element) musi byc obsluzony. Dlugi ogon przypadkow brzegowych to miejsce, gdzie produkty konsumenckie zyja albo umieraja.
Realne osy czasu
Kiedy wiec robot faktycznie zlozy twoje pranie? Oto uczciwa ocena oparta na obecnym stanie badan, tempie postepu przez ostatnie piec lat i rozmowach z badaczami w tej dziedzinie.
2026-2028: Demonstracje laboratoryjne staja sie imponujace. Mozna sie spodziewac systemow badawczych, ktore moga skladac 5-10 typow ubran z wskaznikiem sukcesu 95%+ w kontrolowanych warunkach. Beda robic swietne filmy na YouTube. Nie beda produktami.
2028-2030: Ograniczone proby komercyjne. Firmy zaczna oferowac funkcje skladania prania jako czesc pakietow robotow domowych, prawdopodobnie ze znacznymi ograniczeniami. Mozna sie spodziewac, ze beda dzialac tylko z posortowanymi, nierozlozozonymi ubraniami poloonymi na wyznaczonej powierzchni. Nie mozna ich spodziewac sie przy obsludze losowej sterty z suszarki.
2030-2033: Znaczaca, ale niedoskonala zdolnosc. Postepy w modelach fundacyjnych do manipulacji, lepszy sprzet dotykowy i lata zbierania danych z prawdziwego swiata doprowadza wskazniki sukcesu bliżej 98-99% na powszechnych typach ubran. To bedzie uzyteczne, ale nadal zauważalnie niedoskonale.
2035+: Niezawodnosc klasy konsumenckiej. Osiagniecie progu 99,8%+ na zroznicowanych ubraniach, w niekontrolowanych warunkach domowych, z pelnym odzyskiwaniem po bledach, jest prawdopodobnie dekade przed nami. Harmonogram ten zaklada trwale finansowanie i uwage badawcza, co nie jest gwarantowane.
Droga do domowego skladania prania klasy konsumenckiej
Dema laboratoryjne
2026-2028
Ograniczone komercyjne
2028-2030
Uzyteczne, ale niedoskonale
2030-2033
Niezawodnosc konsumencka
2035+
Te daty moga niektórym Czytelnikom wydawac sie pesymistyczne. Nie sa. Opieraja sie na rzeczywistym tempie postepu w badaniach nad manipulacja obiektami odksztalcalnymi, ktory byl realny, ale powolny - mierzony w postepu o punkty procentowe rocznie, a nie o rzedy wielkosci. Historia robotyki jest usiana przewidywaniami niedoceniajacymi trudnosci zadan prostych dla czlowieka. To jest jedno z takich zadan.
Dlaczego to wazne poza praniem
Skladanie prania nie jest wazne ze wzgledu na pranie. Nikt nie zbuduje robota humanoidalnego za 25 000 dolarow, ktorego jedynym zadaniem bedzie skladanie koszulek. Skladanie prania ma znaczenie, bo jest miernikiem calej kategorii domowych zadan manipulacji zwiazanych z miekkimi, zmiennymi, bogatymi w kontakt oddzialywanimi ze swiatem fizycznym.
Jesli potrafisz skladac pranie, prawdopodobnie potrafisz rowniez:
- Scielac lozko (odksztalcalne prościeradla, koce, poduszki)
- Ladowac zmywarke (rozne ksztalty, delikatne przedmioty, rozumowanie przestrzenne)
- Sortowac i odkladac zakupy (torby, produkty, kruche przedmioty)
- Czyczyc lazienke (mokre powierzchnie, rozne narzedzia, wycieranie bogate w kontakt)
- Gotowac posilek (krojenie, mieszanie, obsluga surowuch skladnikow)
Kazde z tych zadan dzieli glowne wyzwania skladania prania: odksztalcalne lub zmienne obiekty, manipulacja bogata w kontakt, czulnosc na sile i ogromna zmiennosc warunkow. Rozwiazanie skladania nie rozwiazuje automatycznie tych zadan, ale bazowe zdolnosci transferuja sie w duzym stopniu.
Dlatego skladanie prania stalo sie punktem odniesienia w spolecznosci badawczej. Nie dlatego, ze badacze sa obsesyjnie skupieni na czystych ubraniach. Dlatego, ze skladanie jest zwartym, mierzalnym miernikiem ogolnej zdolnosci potrzebnej robotom domowym. Kiedy robot bedzie mogl niezawodnie skladac roznolicone pranie, bedziemy wiedziec, ze fundamentalne zdolnosci manipulacji dla robotyki domowej sa na miejscu.
Firmy i twierdzenia
Warto nakreslić obecny krajobraz firm, ktore w pewnym momencie twierdzily lub sugerowaly, ze ich roboty beda obsługiwac pranie.
Tesla pokazala Optimusa skladajacego koszulke w oskryptowanej demonstracji. Film byl starannie skadrowany, uzyl jednego z gory ustawionego ubrania i pokazal robota teleoperowanego (sterowanego przez czlowieka), a nie dzialajacego autonomicznie. To demonstracja mozliwosci sprzetowych, nie inteligencji programowej. Dlonie moga wykonywac ruchy. AI nie moze jeszcze decydowac, jakie ruchy wykonac.
1X Technologies bylo bardziej ostrozne, opisujac poczatkowe domowe mozliwosci NEO jako skupione na sprzataniu, noszeniu i przynoszeniu, a nie zlozonej manipulacji. To prawdopodobnie wlasciwe podejscie. Obiecywanie mozliwosci, ktore mozna dostarczyc, jest lepsze niz obiecywanie tych, ktorych nie mozna.
Figure AI, skupiajac sie glownie na zastosowaniach przemyslowych, omawial dlugoterminową wizje obejmujaca zadania domowe. Biorąc pod uwage, ze Figure 02 jest obecnie wdrozony w magazynach i halach produkcyjnych, domowe pranie jest prawdopodobnie jeszcze latami poza harmonogramem produktow firmy.
Chinscy producenci, jak Unitree i UBTECH, demonstrowali rozne domowe zdolnosci w kontrolowanych warunkach, ale zadna nie dostarczyla produktu obsługujacego obiekty odksztalcalne w prawdziwych domach.
Uczciwa ocena jest taka, ze zadna firma nie jest bliska dostarczenia robota, ktory sklada pranie w prawdziwych warunkach domowych. Firmy, ktore sa w tej kwestii uczciwe, to te, ktore warto obserwowac. Te, ktore pokazuja oskryptowane demy i sugeruja, ze produkt jest za rogiem, stosuja schemat dzialania, ktory wielokrotnie juz zawiodl.
Na co zwracac uwage
Dla kazdego sledzacego te przestrzen - czy to jako potencjalny nabywca, inwestor, czy po prostu ktos ciekawi - oto sygnaly wskazujace na rzeczywisty postep.
Obserwuj nieoskryptowane dema. Kazda firma moze zlozyc jedno z gory ulozone ubranie teleoperowanym robotem. Znaczaca demonstracja to robot samodzielnie skladajacy losowy stos roznolicowych ubran z kosza na pranie, na zywo, bez montazu, wielokrotnie. Kiedy to zobaczysz, zwroc uwage.
Obserwuj roznorodnosc ubran. Skladanie jednego typu koszulki to nie to samo co skladanie koszulek, spodni, skarperek, bielizny, recznikow i przeznaczonych do dopasowania prościeradeł. Rzeczywisty postep oznacza obsluge pelnego zakresu tekstyliow domowych.
Obserwuj wskazniki porazek. Kiedy badacze publikuja wyniki skladania, look at the success rate and the number of garment types tested. 95% sukces na 3 typach ubran jest bardzo rozny od 95% sukcesu na 30 typach.
Obserwuj predkosc. SpeedFolding zajmuje 120 sekund na ubranie. Czlowiek zajmuje 8 sekund. Kosz 20 elementow zajałby 40 minut w tempie robota wobec mniej niz 3 minut dla czlowieka. Predkosc ma znaczenie dla oplacalnosci konsumenckiej.
Obserwuj sprzet dotykowy. Przelomy w skladaniu prawdopodobnie beda wynikac z lepszych dloni i lepszego czucia dotyku, nie tylko lepszych modeli widzenia. Firmy inwestujace w zreczne dlonie z bogatym sprzezeniem dotykowym pracuja nad wlasciwym problemem.
Piekne trudnosci
Jest cos glębokiego w fakcie, ze skladanie koszulki - zadanie tak proste, ze roztargniony nastolatek moze to robic ogladajac telewizje - stanowi jeden z najtrudniejszych otwartych problemow w calej robotyce. To przypomnienie, ze ludzkie mozliwosci sa niezwykłe. Kombinacja percepcji, planowania, zrecznosci i adaptacji, ktore twoje dlonie i mozg wykonuja codziennie przy obsludze miekkich obiektow, jest produktem setek milionow lat ewolucyjnej optymalizacji.
Robotyka tam dotrze. Tempo postepu w uczeniu manipulacji, czujnosci dotykowej i modelach fundacyjnych jest realne i przyspiesza. Pytanie nie brzmi, czy roboty ostatecznie uloza pranie, ale kiedy - i czy “kiedy” to 2030 czy 2040.
Tymczasem za kazdym razem, gdy prezes firmy robotycznej pokazuje demo robota humanoidalnego wykonujacego prace domowe, zadaj jedno proste pytanie: czy potrafi zlozyc losowy stos prania z suszarki?
Jesli odpowiedz brzmi nie, wiesz dokladnie, jak daleko naprawde jest przyszlosc robotow domowych. A jesli odpowiedz brzmi tak - niezawodnie, na roznolicowych ubraniach, w rozsadnym tempie, w niekontrolowanym srodowisku - to wydarzylo sie cos naprawde niezwyklego. Cos wartego uwagi. Cos, co oznacza, ze paradoks Morawca po dekadach w koncu zaczyna pekac.
Do tego czasu twoj kosz na pranie czeka. I my rowniez.
Źródła
- UC Berkeley AUTOLAB - SpeedFolding: Learning Efficient Bimanual Folding of Garments - dostęp 2026-03-25
- Columbia University - FlingBot: The Unreasonable Effectiveness of Dynamic Manipulation for Cloth - dostęp 2026-03-25
- CMU Robotics Institute - Learning to Manipulate Deformable Objects without Demonstrations - dostęp 2026-03-25
- Stanford ILIAD Lab - Deformable Object Manipulation Survey - dostęp 2026-03-25
- MIT CSAIL - Robotic Fabric Manipulation - dostęp 2026-03-25
- IEEE Transactions on Robotics - A Survey on Cloth Manipulation - dostęp 2026-03-25
- Science Robotics - Sim-to-Real Transfer for Deformable Object Manipulation - dostęp 2026-03-25
- UC Berkeley - DextAIRity: Deformable Manipulation Can be a Breeze - dostęp 2026-03-25
- Google DeepMind - RT-2: Vision-Language-Action Models - dostęp 2026-03-25
- International Journal of Robotics Research - Benchmarking Deformable Object Manipulation - dostęp 2026-03-25
- Nature Machine Intelligence - Foundation Models for Robotics - dostęp 2026-03-25
- Seven Dreamers Laundroid - Postmortem Analysis - dostęp 2026-03-25
- Toyota Research Institute - Diffusion Policy for Manipulation - dostęp 2026-03-25
- Carnegie Mellon University - Garment Perception and Manipulation - dostęp 2026-03-25
- Goldman Sachs - Humanoid Robots Market Report - dostęp 2026-03-25
Powiązane artykuły
1X NEO Gamma za 499 dolarow miesiecznie: pierwszy robot, ktorego naprawde mozesz wynajac
Kazda inna firma produkujaca roboty humanoidalne goni kontrakty fabryczne. 1X Technologies stawia wszystko na Twoj salon. Za 499 dolarow miesiecznie, ze wsparciem OpenAI i juz podpisana umowa na 10 000 sztuk, NEO Gamma to albo najodwazniejszy ruch w robotyce, albo najdrozszy abonament, ktorego nigdy nie odnowisz.
Roboty humanoidalne w Twoim domu do 2028 roku: czego naprawdę się spodziewać
Każdy prezes firmy robotycznej obiecuje, że robot domowy jest tuż za rogiem. Sprawdziliśmy realne harmonogramy, faktyczne możliwości i uczciwe ceny, żeby określić, czego konsumenci powinni naprawdę oczekiwać.
AgiBot dostarczył więcej robotów niż Tesla, Figure i Apptronik razem wzięci. Prawdopodobnie nigdy o nich nie słyszałeś.
AgiBot dostarczył 5200 robotów humanoidalnych, podczas gdy Tesla osiągnęła 500, Figure AI dostarczyło 200, a Apptronik 50. Łącznie trzy najbardziej nagłaśniane amerykańskie programy humanoidalne dostarczyły jedną siódmą tego, co osiągnął szanghajski startup w niecałe dwa lata. Liczby ujawniają martwy punkt zachodnich mediów, który ma realne konsekwencje.
Brett Adcock zebrał 1,85 miliarda dolarów na robota, którego konsumenci jeszcze nie mają
Brett Adcock założył trzy firmy w trzech różnych branżach. Pierwszą sprzedał. Drugą wprowadził na giełdę. Trzecia jest wyceniana na 39 miliardów dolarów z 200 wdrożonymi robotami. Jego kariera to studium przypadku tego, jak działa gospodarka Doliny Krzemowej oparta na kulcie założycieli, i czy wzorzec, który stworzył Vettery i Archer Aviation, może wytworzyć firmę, która naprawdę umieści humanoidalne roboty w codziennym życiu.