Proyek AI besar Facebook Untuk Video Publik Sedang Di Uji Coba

Mengajar sistem AI untuk memahami apa yang terjadi dalam video selengkap mungkin adalah salah satu tantangan tersulit - dan terobosan potensial terbesar - di dunia pembelajaran mesin. Hari ini, Facebook mengumumkan inisiatif baru yang diharapkan akan memberikan keunggulan dalam pekerjaan konsekuensial ini: melatih AI-nya di video publik pengguna Facebook.

Facebook Watch – a quick guide – dotkumo

Akses ke data pelatihan adalah salah satu keunggulan kompetitif terbesar dalam AI, dan dengan mengumpulkan sumber daya ini dari jutaan dan jutaan penggunanya, raksasa teknologi seperti Facebook, Google, dan Amazon dapat terus maju di berbagai bidang. Dan sementara Facebook telah melatih model visi mesin pada miliaran gambar yang dikumpulkan dari Instagram, sebelumnya belum mengumumkan proyek dengan ambisi serupa untuk pemahaman video.

"Dengan belajar dari aliran global video yang tersedia untuk publik yang mencakup hampir setiap negara dan ratusan bahasa, sistem AI kami tidak hanya akan meningkatkan akurasi tetapi juga beradaptasi dengan dunia yang bergerak cepat dan mengenali nuansa dan isyarat visual di berbagai budaya dan wilayah," kata perusahaan di blog. Proyek, berjudul Belajar dari Video , juga merupakan bagian dari "upaya lebih luas Facebook untuk membuat mesin yang belajar seperti manusia."

Model pembelajaran mesin yang dihasilkan akan digunakan untuk membuat sistem rekomendasi konten baru dan alat moderasi, kata Facebook, tetapi dapat melakukan lebih banyak lagi di masa mendatang. AI yang dapat memahami konten video dapat memberi Facebook wawasan yang belum pernah ada sebelumnya tentang kehidupan pengguna, memungkinkan mereka untuk menganalisis hobi dan minat, preferensi merek dan pakaian, dan detail pribadi lainnya yang tak terhitung jumlahnya. Tentu saja, Facebook sudah memiliki akses ke informasi semacam itu melalui operasi penargetan iklannya saat ini, tetapi kemampuan mengurai video melalui AI akan menambah sumber data yang sangat kaya (dan invasif) ke tokonya.

Facebook tidak jelas tentang rencana masa depannya untuk model AI yang dilatih pada video pengguna. Perusahaan tersebut mengatakan kepada The Verge bahwa model tersebut dapat digunakan untuk sejumlah kegunaan, mulai dari membuat teks video hingga membuat fungsi pencarian lanjutan, tetapi tidak menjawab pertanyaan apakah model tersebut akan digunakan untuk mengumpulkan informasi untuk penargetan iklan atau tidak. Demikian pula, ketika ditanya apakah pengguna harus menyetujui video mereka digunakan untuk melatih AI Facebook atau jika mereka dapat memilih keluar, perusahaan hanya menjawab dengan mencatat bahwa Kebijakan Datanya mengatakan konten yang diunggah pengguna dapat digunakan untuk “penelitian dan pengembangan produk. ” Facebook juga tidak menanggapi pertanyaan yang menanyakan dengan tepat berapa banyak video yang akan dikumpulkan untuk melatih sistem AI-nya atau bagaimana akses ke data ini oleh para peneliti perusahaan akan diawasi.

Namun, dalam posting blognya yang mengumumkan proyek tersebut, jaringan sosial tersebut menunjukkan satu penggunaan spekulatif di masa depan: menggunakan AI untuk mengambil "memori digital" yang ditangkap oleh kacamata pintar.

Facebook berencana untuk merilis kacamata pintar konsumen sekitar tahun ini . Detail tentang perangkat tidak jelas, tetapi kemungkinan kacamata ini atau yang akan datang akan menyertakan kamera terintegrasi untuk menangkap sudut pandang pemakainya. Jika sistem AI dapat dilatih untuk memahami konten video, maka itu akan memungkinkan pengguna untuk mencari rekaman masa lalu, seperti halnya banyak aplikasi foto yang memungkinkan orang untuk mencari lokasi, objek, atau orang tertentu. (Ini adalah informasi, kebetulan, yang sering diindeks oleh sistem AI yang dilatih berdasarkan data pengguna.)

Karena merekam video dengan kacamata pintar "menjadi hal yang biasa," kata Facebook, "orang harus dapat mengingat momen-momen tertentu dari kumpulan besar memori digital mereka semudah merekamnya." Ini memberikan contoh pengguna yang melakukan penelusuran dengan frasa "Tunjukkan padaku setiap kali kita menyanyikan selamat ulang tahun untuk Nenek", sebelum disajikan klip yang relevan. Seperti yang dicatat perusahaan, penelusuran semacam itu akan mengharuskan sistem AI membangun koneksi antar jenis data, mengajari mereka "untuk mencocokkan frasa 'selamat ulang tahun' dengan kue, lilin, orang yang menyanyikan berbagai lagu ulang tahun, dan banyak lagi." Sama seperti manusia, AI perlu memahami konsep kaya yang terdiri dari berbagai jenis input sensorik.

Melihat ke masa depan, kombinasi kacamata pintar dan pembelajaran mesin akan memungkinkan apa yang disebut sebagai "pengikisan dunia" - menangkap data granular tentang dunia dengan mengubah pemakai kacamata pintar menjadi kamera CCTV keliling. Seperti praktik yang dijelaskan dalam laporan tahun lalu dari The Guardian : “ Setiap kali seseorang menjelajahi supermarket, kacamata pintar mereka akan merekam data harga waktu nyata, tingkat stok, dan kebiasaan menjelajah; setiap kali mereka membuka koran, kacamata mereka akan tahu cerita mana yang mereka baca, iklan mana yang mereka lihat, dan gambar selebriti pantai mana yang dilihat oleh pandangan mereka. ”

Ini adalah hasil yang ekstrem dan bukan jalan penelitian yang menurut Facebook sedang dieksplorasi. Tapi itu menggambarkan potensi signifikansi dari memasangkan analisis video AI tingkat lanjut dengan kacamata pintar - yang tampaknya ingin dilakukan oleh jejaring sosial.

Sebagai perbandingan, satu-satunya penggunaan alat analisis video AI barunya yang saat ini diungkapkan Facebook relatif biasa-biasa saja. Bersamaan dengan pengumuman Learning from Videos hari ini, Facebook mengatakan telah menerapkan sistem rekomendasi konten baru berdasarkan karya videonya di Gulungan klon TikTok. "Video populer sering kali berisi set musik yang sama dengan gerakan tarian yang sama, tetapi dibuat dan diperankan oleh orang yang berbeda," kata Facebook. Dengan menganalisis konten video, AI Facebook dapat menyarankan klip serupa kepada pengguna.

Algoritme rekomendasi konten tersebut bukannya tanpa potensi masalah. Sebuah laporan terbaru dari MIT Technology Review menyoroti bagaimana penekanan jaringan sosial pada pertumbuhan dan keterlibatan pengguna telah menghentikan tim AI-nya dari sepenuhnya menangani bagaimana algoritma dapat menyebarkan informasi yang salah dan mendorong polarisasi politik. Seperti yang dikatakan dalam artikel Technology Review : "Model [machine learning] yang memaksimalkan interaksi juga mendukung kontroversi, misinformasi, dan ekstremisme". Ini menciptakan konflik antara tugas peneliti etika AI Facebook dan kredo perusahaan untuk memaksimalkan pertumbuhan.

Facebook bukan satu-satunya perusahaan teknologi besar yang mengejar analisis video AI tingkat lanjut, juga bukan satu-satunya yang memanfaatkan data pengguna untuk melakukannya. Google, misalnya, mengelola kumpulan data penelitian yang dapat diakses publik yang berisi 8 juta video YouTube yang dikurasi dan diberi label sebagian untuk "membantu mempercepat penelitian tentang pemahaman video skala besar". Operasi iklan raksasa pencarian juga bisa mendapatkan keuntungan dari AI yang memahami konten video, meskipun hasil akhirnya hanya menyajikan iklan yang lebih relevan di YouTube.

Facebook, bagaimanapun, menganggapnya memiliki satu keunggulan khusus dibandingkan para pesaingnya. Tidak hanya memiliki banyak data pelatihan, tetapi juga mendorong lebih banyak sumber daya ke dalam metode AI yang dikenal sebagai pembelajaran yang diawasi sendiri.PEMBELAJARAN YANG DIAWASI SENDIRI ADALAH "MATERI GELAP KECERDASAN".

Biasanya, ketika model AI dilatih pada data, input tersebut harus diberi label oleh manusia : menandai objek dalam gambar atau menyalin rekaman audio, misalnya. Jika Anda pernah memecahkan CAPTCHA yang mengidentifikasi hidran kebakaran atau penyeberangan pejalan kaki, Anda mungkin telah memberi label data yang membantu melatih AI. Tetapi pembelajaran yang diawasi sendiri menghilangkan label, mempercepat proses pelatihan, dan, beberapa peneliti percaya, menghasilkan analisis yang lebih dalam dan lebih bermakna saat sistem AI mengajar diri mereka sendiri untuk menggabungkan titik-titik. Facebook sangat optimis tentang pembelajaran yang diawasi sendiri sehingga menyebutnya "materi gelap kecerdasan."

Perusahaan mengatakan pekerjaan masa depannya pada analisis video AI akan fokus pada metode pembelajaran semi-dan yang diawasi sendiri, dan bahwa teknik semacam itu "telah meningkatkan visi komputer dan sistem pengenalan suara kami". Dengan banyaknya konten video yang tersedia dari 2,8 miliar pengguna Facebook, melewatkan bagian pelabelan pelatihan AI tentu masuk akal. Dan jika jejaring sosial dapat mengajarkan model pembelajaran mesinnya untuk memahami video dengan lancar, siapa yang tahu apa yang mungkin mereka pelajari?