Google menggunakan alat baru untuk membantu memahami nama vaksin, tetapi juga dapat mengubah pencarian selamanya

Hal yang sama yang memiliki nama yang mirip di berbagai belahan dunia atau budaya, adalah masalah Google Pencarian dihadapi untuk waktu yang lama. Jadi ketika saya menghadapi tantangan serupa di sekitar COVID-19 Nama-nama vaksin, raksasa teknologi beralih ke alat Multitasking Unified Model (MUM) untuk bantuan.

Karena AstraZeneca, CoronaVac, Moderna, Pfizer, Sputnik, dan vaksin yang didistribusikan secara luas lainnya memiliki nama yang berbeda di seluruh dunia, “Kemampuan Google untuk mengidentifikasi semua nama ini dengan benar sangat penting untuk memberikan informasi terbaru dan tepercaya tentang vaksin kepada orang-orang.” Sejauh ini menggunakan platform pencarian MUM untuk “mengidentifikasi lebih dari 800 jenis nama vaksin yang berbeda dalam lebih dari 50 bahasa dalam hitungan detik,” Pandu Nayak, Google Fellow dan Wakil Presiden, Search menulis dalam sebuah posting blog. “Setelah memvalidasi hasil MUM, kami menerapkannya ke pencarian Google sehingga orang dapat menemukan informasi berkualitas tinggi dan tepat waktu tentang vaksin COVID-19 di seluruh dunia.”

“MUM adalah deep neural network yang terdiri dari switch seperti BERT (Bi-Directional Encryption Representations of Switches),” jelas Nayak saat dihubungi. Pada tahun 2018, Google meluncurkan BERT, teknologi prapelatihan Natural Language Processing (NLP) berbasis jaringan saraf yang memungkinkan siapa saja melatih sistem canggih untuk menjawab pertanyaan. “Tetapi dalam banyak hal, MUM benar-benar berbeda dari BERT. Seperti BERT, ia dapat memahami bahasa menggunakan encoder…tetapi selain itu, ia juga memiliki seperangkat decoder yang memungkinkannya menghasilkan teks, kata Nayak, menambahkan bahwa Arsitektur khusus ini adalah model teks-ke-teks berdasarkan arsitektur T5 yang dikembangkan oleh Google Research.

Nayak mengatakan MUM dilatih pada subset web berkualitas tinggi setelah menghapus konten berkualitas rendah. Itu juga dilatih dalam semua 75 bahasa pada saat yang sama, “jadi ini adalah model multibahasa secara intrinsik.” Menjelaskan manfaatnya: “Apa yang memungkinkan kami lakukan adalah menggeneralisasi dari bahasa yang kaya akan data ke data untuk bahasa yang dokumennya lebih sedikit.” Juga, MUM adalah “jenis pelatihan multi-modal intrinsik” dan dapat diperluas ke gambar dan sejenisnya.

Ini pada dasarnya berarti bahwa model dapat belajar dalam satu bahasa dan menyebarkan pengetahuan dalam bahasa lain. Juga, untuk Google, ini diterjemahkan sebagai mekanisme cerdas yang tidak perlu dipelajari secara terpisah dalam semua bahasa.

Peluang tidak terbatas. “Kami pikir ini adalah platform di mana tim yang berbeda dapat menggunakan platform ini untuk kasus penggunaan masing-masing. Jadi satu tim mungkin menggunakannya untuk meningkatkan klasifikasi, satu tim untuk meningkatkan peringkat dan yang lain untuk mengekstrak informasi, dan tim lain untuk membuat aplikasi yang sama sekali baru. Jadi intinya multitasking…”, Konfirmasi.

Mengenali nama vaksin hanyalah awal dari apa yang bisa menjadi hal besar. “Pengujian awal kami menunjukkan bahwa MUM tidak hanya akan dapat meningkatkan banyak aspek dari sistem kami yang ada, tetapi juga akan membantu kami menciptakan cara yang sama sekali baru untuk mencari dan menjelajahi informasi,” posting blog menjelaskan.

Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *