หลักสูตรอุปสรรคเสมือนจริงเหล่านี้ช่วยให้หุ่นยนต์ตัวจริงเรียนรู้ที่จะเดิน

คลิปจากการจำลองที่หุ่นยนต์เสมือนเรียนรู้ที่จะปีนบันได กองทัพที่มีหุ่นยนต์คล้ายสุนัขเดินทัพมากกว่า 4,000 ตัวเป็นภาพที่น่ากลัวอย่างคลุมเครือ แม้แต่ในการจำลอง แต่มันอาจชี้ทางให้เครื่องจักรเรียนรู้กลเม็ดใหม่ๆ กองทัพหุ่นยนต์เสมือนได้รับการพัฒนาโดยนักวิจัยจาก ETH Zurich ในสวิตเซอร์แลนด์และผู้ผลิตชิป Nvidia พวกเขาใช้บอทเร่ร่อนเพื่อฝึกอัลกอริธึมที่ใช้ในการควบคุมขาของหุ่นยนต์ในโลกแห่งความเป็นจริง ในการจำลอง เครื่องจักรที่เรียกว่า ANYmals เผชิญกับความท้าทายต่างๆ เช่น ทางลาด ขั้นบันได และทางลาดชันในภูมิทัศน์เสมือนจริง ทุกครั้งที่หุ่นยนต์เรียนรู้ที่จะนำทางความท้าทาย นักวิจัยได้นำเสนอสิ่งที่ยากขึ้น โดยผลักดันให้อัลกอริทึมการควบคุมมีความซับซ้อนมากขึ้น จากระยะไกล ฉากที่ได้จะคล้ายกับกองทัพมดที่ดิ้นไปมาเป็นบริเวณกว้าง ระหว่างการฝึก หุ่นยนต์สามารถควบคุมการเดินขึ้นและลงบันไดได้ง่ายพอสมควร อุปสรรคที่ซับซ้อนมากขึ้นใช้เวลานานขึ้น การจัดการกับทางลาดนั้นยากเป็นพิเศษ แม้ว่าหุ่นยนต์เสมือนจริงบางตัวจะเรียนรู้วิธีเลื่อนลงมาก็ตาม เมื่ออัลกอริธึมที่ได้ย้ายไปเป็นเวอร์ชันจริงของ ANYmal ซึ่งเป็นหุ่นยนต์สี่ขาที่มีขนาดประมาณสุนัขตัวใหญ่ที่มีเซ็นเซอร์อยู่ที่หัวและแขนหุ่นยนต์ที่ถอดออกได้ มันสามารถนำทางบันไดและบล็อกต่างๆ ได้ แต่ประสบปัญหาด้วยความเร็วสูงกว่า . นักวิจัยตำหนิความไม่ถูกต้องในการที่เซ็นเซอร์รับรู้โลกแห่งความเป็นจริงเมื่อเทียบกับการจำลอง การเรียนรู้ด้วยหุ่นยนต์ในลักษณะเดียวกันนี้จะช่วยให้เครื่องจักรเรียนรู้สิ่งที่มีประโยชน์ทุกประเภท ตั้งแต่การคัดแยกบรรจุภัณฑ์ไปจนถึงการตัดเย็บเสื้อผ้าและการเก็บเกี่ยวพืชผล โครงการนี้ยังสะท้อนถึงความสำคัญของการจำลองและชิปคอมพิวเตอร์แบบกำหนดเองสำหรับความก้าวหน้าในอนาคตของปัญญาประดิษฐ์ประยุกต์ Pieter Abbeel ศาสตราจารย์แห่ง UC Berkeley และผู้ร่วมก่อตั้ง Covariant ซึ่งเป็นบริษัทที่ใช้ AI และการจำลองเพื่อฝึกแขนหุ่นยนต์ในการเลือกและจัดเรียงวัตถุในระดับสูง กล่าวว่า “ในระดับสูง การจำลองอย่างรวดเร็วเป็นสิ่งที่ยอดเยี่ยมจริงๆ บริษัทโลจิสติกส์ เขากล่าวว่านักวิจัยชาวสวิสและ Nvidia “ได้รับการเร่งความเร็วที่ดี” AI ได้แสดงสัญญาสำหรับการฝึกหุ่นยนต์ให้ทำงานจริงที่ไม่สามารถเขียนลงในซอฟต์แวร์ได้ง่ายหรือต้องมีการดัดแปลงบางอย่าง ความสามารถในการจับวัตถุที่น่าอึดอัด ลื่น หรือไม่คุ้นเคย เป็นต้น ไม่ใช่สิ่งที่สามารถเขียนลงในบรรทัดของโค้ดได้ หุ่นยนต์จำลอง 4,000 ตัวได้รับการฝึกฝนโดยใช้การเรียนรู้แบบเสริมกำลัง ซึ่งเป็นวิธีการของ AI ที่ได้รับแรงบันดาลใจจากการวิจัยว่าสัตว์เรียนรู้ได้อย่างไรผ่านการตอบรับเชิงบวกและเชิงลบ ขณะที่หุ่นยนต์ขยับขา อัลกอริธึมจะตัดสินว่าสิ่งนี้ส่งผลต่อความสามารถในการเดินของพวกมันอย่างไร และปรับอัลกอริธึมการควบคุมตามนั้น