Trong bối cảnh công nghệ robot toàn cầu đang chạy đua để tạo ra những cỗ máy thông minh hơn phục vụ con người, một nhóm nghiên cứu tại Đại học Texas A&M (Hoa Kỳ) vừa công bố một bước đột phá đáng chú ý. Họ đã phát triển thành công một khung điều hướng dựa trên bộ nhớ, biến những chú chó robot thông thường thành những trợ thủ đắc lực trong các nhiệm vụ tìm kiếm và cứu nạn.
Theo thông tin từ nhóm nghiên cứu, hệ thống này không dừng lại ở mức độ tự động hóa cơ bản. Thay vào đó, nó được thiết kế để vận hành trong những môi trường hỗn loạn, chó robot thế hệ mới sở hữu khả năng “nhìn”, ghi nhớ vị trí và tự đưa ra các quyết định xử lý tình huống. Đại diện nhóm nghiên cứu khẳng định: “Nó hiểu các mệnh lệnh bằng giọng nói và sử dụng trí tuệ nhân tạo (AI) cùng dữ liệu từ camera để thực hiện việc lập kế hoạch đường đi và nhận diện vật thể”.
Sự kết hợp giữa tư duy chiến lược và phản ứng nhanh
Điểm cốt lõi của công nghệ này nằm ở mô hình ngôn ngữ lớn đa phương thức (MLLM) được tích hợp vào robot địa hình. Khác với các phương pháp điều hướng truyền thống vốn chỉ dựa vào các cột mốc đơn giản, hệ thống mới cho phép robot xử lý các đầu vào hình ảnh phức tạp để xây dựng nhận thức về môi trường.
Cụ thể, robot sử dụng một kiến trúc điều khiển lai. Cơ chế này cho phép nó vừa có khả năng suy luận cấp cao để vạch ra chiến lược dài hạn, vừa có thể thực hiện các điều chỉnh nhanh chóng trong thời gian thực.
Theo các nhà nghiên cứu, cách thức hoạt động này rất giống với con người khi di chuyển trong một khu vực xa lạ: vừa có sự tính toán chủ đích về đích đến, vừa có phản xạ tức thì để tránh né chướng ngại vật.
Sự linh hoạt này là yếu tố sống còn tại các khu vực thảm họa, tòa nhà bị sập hoặc địa hình hiểm trở, nơi mà cấu trúc môi trường liên tục thay đổi và khó lường.
Vai trò của “bộ nhớ” trong môi trường khắc nghiệt
Một trong những tính năng ưu việt nhất được nhấn mạnh là khả năng “ghi nhớ” của robot. Hệ thống điều hướng cho phép nó nhớ lại và tái sử dụng các tuyến đường đã từng đi qua. Điều này giúp giảm thiểu việc di chuyển thừa thãi, tiết kiệm năng lượng và thời gian – những yếu tố vốn được coi là “vàng ngọc” trong các sứ mệnh cứu hộ.
Đặc biệt, tại các khu vực mất tín hiệu GPS hoặc chưa có bản đồ địa hình, khả năng tự định vị và ghi nhớ này trở thành chìa khóa để duy trì hoạt động tìm kiếm liên tục và tin cậy.
Sanjaya Mallikarachchi, nghiên cứu sinh tiến sĩ kỹ thuật liên ngành tại Đại học Texas A&M, nhận định: “Trong tương lai, loại cấu trúc điều khiển này có khả năng sẽ trở thành một tiêu chuẩn chung cho các robot giống người”.
Trước đó, vào tháng trước, các nhà nghiên cứu tại MIT cũng đã giới thiệu một hệ thống AI cho phép robot tạo bản đồ 3D chi tiết để cải thiện khả năng điều hướng. Tuy nhiên, việc Đại học Texas A&M kết hợp thành công mô hình ngôn ngữ đa phương thức với bộ nhớ thị giác trên một nền tảng mô-đun đa năng được đánh giá là một hướng đi mới lạ và đầy triển vọng.

Tương lai của tương tác người và máy
Dự án này nhận được sự hỗ trợ từ Quỹ khoa học quốc gia, không chỉ nhắm đến mục tiêu cứu nạn. Theo phó giáo sư Isuru Godage thuộc Khoa công nghệ kỹ thuật và phân phối công nghiệp tại Texas A&M, cốt lõi tầm nhìn của họ là triển khai MLLM ngay tại biên (edge). Điều này mang lại cho robot nhận thức tình huống cấp cao và thậm chí là “trí tuệ cảm xúc” – những điều trước đây được xem là bất khả thi.
“Điều này cho phép hệ thống thu hẹp khoảng cách tương tác giữa con người và máy móc một cách liền mạch”, phó giáo sư Godage chia sẻ.
Tiềm năng ứng dụng của công nghệ này được đánh giá là vô cùng rộng lớn. Ngoài việc hỗ trợ các đội ứng phó khẩn cấp, hệ thống có thể được triển khai tại các bệnh viện, nhà kho để hợp lý hóa quy trình vận hành.
Hơn thế nữa, nó mở ra hy vọng mới trong việc hỗ trợ di chuyển cho người khiếm thị, hoặc thực hiện các nhiệm vụ nguy hiểm như trinh sát vùng chiến sự và rà phá bom mìn, giúp giảm thiểu rủi ro cho con người.


