Para ahli dari Toyohashi University of Technology telah menciptakan model Artificial Intelligence (AI) yang secara bersamaan menangani persepsi dan kontrol kendaraan otonom.
Model AI dengan mahir merasakan lingkungan sekitar melalui berbagai tugas penglihatan sambil mengendalikan kendaraan otonom saat mengikuti serangkaian titik rute. Model ini dapat dengan aman menavigasi kendaraan melalui kondisi lingkungan yang beragam di bawah berbagai skenario dan telah diuji dengan tugas navigasi titik-ke-titik, mencapai kemampuan berkendara terbaik di antara model yang baru-baru ini diuji dalam pengaturan simulasi standar.
Tantangan dengan mengemudi otonom
Mengemudi otonom adalah sistem yang sangat kompleks yang terdiri dari berbagai subsistem yang mengelola tugas persepsi dan kontrol. Namun demikian, menggunakan beberapa modul khusus tugas mahal dan tidak efisien karena beberapa konfigurasi masih diperlukan untuk membentuk sistem modular terintegrasi.
Selain itu, proses integrasi dapat mengakibatkan hilangnya informasi karena banyak parameter yang disesuaikan secara manual. Namun, ini dapat dilawan dengan penelitian pembelajaran yang cepat dan mendalam untuk melatih satu model AI dengan perilaku menyeluruh dan multi-tugas.
Hal ini memungkinkan model untuk memberikan kontrol navigasi ke kendaraan otonom berdasarkan pengamatan yang dilakukan oleh sensor. Konfigurasi manual tidak lagi diperlukan karena model dapat mengelola informasi itu sendiri.
Kesulitan yang tersisa untuk model ujung ke ujung adalah bagaimana mengekstrak informasi yang berguna bagi pengontrol untuk memperkirakan kontrol navigasi dengan benar. Hal ini dapat diatasi dengan memberikan sejumlah besar data ke modul persepsi sehingga dapat lebih memahami lingkungan. Selain itu, teknik fusi sensor dapat diterapkan untuk meningkatkan kinerja karena menggabungkan berbagai sensor untuk mendapatkan beberapa aspek data.
Namun, model yang lebih besar ini diperlukan untuk memproses lebih banyak data dan menyebabkan beban komputasi yang cukup besar. Selain itu, diperlukan teknik preprocessing data karena beberapa sensor dapat menghasilkan modalitas data yang berbeda. Pembelajaran yang tidak seimbang selama proses pelatihan juga dapat menyebabkan masalah karena model melakukan tugas persepsi dan kontrol pada saat yang bersamaan.
Menyempurnakan AI
Untuk mengatasi keterbatasan ini, para peneliti mengembangkan model AI yang dilatih dengan perilaku end-to-end dan multi-tugas yang mencakup dua modul utama – modul persepsi dan pengontrol. Fase persepsi dimulai dengan memproses gambar RGB dan peta kedalaman dari satu kamera RGBD.
Informasi kemudian diekstraksi dari modul persepsi di samping pengukuran kecepatan kendaraan dan koordinat titik rute yang diterjemahkan oleh modul pengontrol untuk memperkirakan kontrol navigasi.
Untuk menjamin bahwa semua tugas dilakukan secara merata, tim menggunakan algoritme yang disebut normalisasi gradien yang dimodifikasi (MGN) untuk menyeimbangkan sinyal pembelajaran selama proses pelatihan. Tim menggunakan pembelajaran imitasi, memungkinkan model untuk belajar dari kumpulan data yang lebih besar untuk mencapai kinerja yang mendekati manusia. Para peneliti juga merancang AI untuk menggunakan lebih sedikit parameter daripada yang lain untuk mengurangi beban komputasi.
Menggunakan simulator mengemudi otonom standar yang dikenal sebagai CARLA menunjukkan bahwa menggabungkan gambar RGB dan peta kedalaman untuk membuat peta semantik bird-eye-view (BEV) meningkatkan kinerja secara keseluruhan. Ini karena model persepsi lebih memahami pemandangan, dan modul pengontrol dapat memanfaatkan data untuk memperkirakan kontrol navigasi secara optimal.
Tim menyimpulkan bahwa model AI lebih disukai untuk ditempatkan di kendaraan otonom karena mencapai kemampuan berkendara yang lebih baik dengan parameter yang lebih sedikit daripada model lainnya. Mereka sekarang bekerja untuk meningkatkan model agar berkinerja lebih baik dalam kondisi pencahayaan yang buruk, seperti pada malam hari dan hujan lebat.