Mengenali bentuk dan gambar cukup kompleks untuk komputer pada permukaan 2D (flat). Ketika sampai pada pengenalan objek 3D, keadaan menjadi jauh lebih sulit karena bentuk objek berubah secara dramatis pada berbagai sudut, jarak dan kondisi pencahayaan – hanya memikirkan selembar kertas seperti pinggiran jalan jika dibandingkan secara penuh, atau bagaimana sebuah pohon terlihat sangat berbeda saat berbunga atau saat semua daunnya telah jatuh.
Laboratorium seperti Australian Centre for Visual Technologies di kampus University of Adelaide sedang mengerjakan visualisasi objek 3D yang canggih dan pengakuan untuk berbagai aplikasi seperti 3D scanning, augmented reality, robotic dan autonomous driving dengan bantuan akselerator NVIDIA Tesla GPU. GPU memproses sejumlah besar pesanan data yang besarnya lebih cepat dari pada CPU tradisional, dan memberikan horsepower untuk menjalankan simulasi kompleks lebih cepat dari sebelumnya.
University of Adelaide, sebagai salah satu universitas riset terkemuka di Australia, menggunakan pembelajaran mesin, artificial intelligence (AI) dan berbagai teknik seperti structure from motion (SfM) untuk memastikan bahwa sistem cerdas seperti robot atau mobil yang dapat mengemudi sendiri dapat menganalisis secara akurat tiap kejadian yang mereka alami. Tanpa kemampuan ini, adalah mustahil bagi mobil untuk dapat membedakan kendaraan dari pejalan kaki atau untuk memutuskan dimana jalan berakhir dan tepi jalan dimulai.
Ravi Garg, Senior Research Associate, Australian Centre for Visual Technologies, The University of Adelaide, menjelaskan bahwa kejadian-kejadian dapat dipecah menjadi bentuk geometris yang kemudian dapat di identifikasi sebagai objek tidak peduli bagaimana mereka diputar. Setelah berbagai property seperti ukuran, kecepatan dan arah gerakan ditugaskan pada suatu objek, sistem cerdas seperti robot atau sebuah mobil dapat bereaksi dengan tepat. Bahkan mungkin bagi sistem semacam itu untuk Merekonstruksi objek 3D dari pandangan terbatas sebuah adegan.
“Latar belakang saya sebagian besar terkait dengan struktur dari gerakan dimana kita melihat banyak gambar dari berbagai sudut pandang,” ujar Garg. “Yang ingin kita lakukan adalah memahami geometri sebuah adegan. Apa yang sedang kita kerjakan sekarang adalah tidak hanya menggunakan pembelajaran mesin dan AI sebagai alat untuk memberikan input, output dan mengembangkan pemetaan, tetapi juga untuk melihat bagaimana kita dapat mencapai hasil yang konsisten dalam situasi baru dan menghasilkan lebih banyak wawasan tentang pembelajaran.”
Garg bekerja dengan Professor Ian Reid dalam proyek Laureate Fellowship yang diberinama “Lifelong Computer Vision Systems”. Proyek ini bertujuan untuk mengembangkan sistem penglihatan komputer yang kuat yang dapat beroperasi di wilayah yang luas dan dalam waktu yang lama, seiring dengan perubahan lingkungan dari waktu ke waktu.
Tujuan akhirnya menurut Garg, adalah untuk menciptakan sistem pembelajaran mandiri yang dapat mengumpulkan dan menganalisa adegan secara otomatis. “Di University of Adelaide, kami sedang mengerjakan sistem pembelajaran tanpa pengawasan yang sangat sesuai utnuk perawatan kesehatan, dimana ada ketergantungan yang tinggi pada para ahli untuk pengambilan keputusan. Alih-alih meminta pakar untuk mendiagnosis jutaan titik data, kami dapat memberikan skrining awal terhadap sejumlah besar data medis. Kita dapat memiliki sistem yang dapat membantu dokter mengklasifikasi tumor atau bahkan membantu operasi invasif,” ujar Garg.
Penelitian Garg dimungkinkan melalui state-of-the-art horsepower dari supercomputer universitas Phoenix, yang mulai beroperasi pada tahun 2016. Supercomputer ini berbasis pada teknologi Lenovo dan didukung oleh akselerator GPU NVIDIA Tesla, untuk menangani beban kerja komputasi berperforma tinggi (high performance computing (HPC)). Phoenix telah mengurangi waktu yang dihabiskan untuk menunggu sumber daya HPC di University of Adelaide dan mendapatkan hasil penelitian yang lebih cepat.