Microsoft Research membuat sistem yang mampu menghasilkan keterangan "pintar" secara otomatis
Daftar Isi:
Pastinya Anda menemukan teks yang membingungkan, salah, atau tidak banyak menjelaskan tentang gambar yang dimaksud; dan bahkan mungkin, jika Anda mendedikasikan diri untuk menerbitkan artikel Anda sendiri, Anda merasa paling membosankan untuk mengisi bagian ini. Nah, orang-orang dari Redmond telah membuat alat yang bertujuan untuk mempermudah Anda.
Sebuah karya yang diterbitkan oleh Microsoft Research yang mendeskripsikan dirinya sebagai “sistem pembuat teks” yang mampu meniru karakteristik naratif bahasa manusia, yaitu teknologi yang dapat menggambarkan tangkapan layar seolah-olah tentang salah satu dari kita, dengan konteksnya yang sesuai.Sesuatu yang telah dikerjakan oleh perusahaan seperti Facebook, Microsoft, dan Google selama beberapa waktu, tetapi kali ini melebihi ekspektasi.
Terdiri dari apa
Dia bersenang-senang
Dengan cara ini, sistem bahkan memiliki kemampuan untuk menceritakan kisah lengkap dari beberapa gambar, mendeskripsikannya, dan menceritakannya seolah-olah itu adalah sebuah buku. Utilitas yang, menurut para ahli, dapat berakhir menjadi fitur yang memberikan sentuhan lebih manusiawi pada aplikasi tertentu, aplikasi pengenalan suara, secara otomatis menghasilkan deskripsi di area lain dan banyak lagi.
Dan faktanya adalah bahwa alat tidak terbatas pada mengatakan, secara singkat, apa yang “dilihatnya”, melainkan memberikan gambaran yang lebih luas konteks situasi yang tercermin dalam gambar, mencapai "konteks naratif dan gaya narasi yang unik", jelas Frank Ferraro, salah satu penulis karya ini.Untuk menempatkan diri kita dalam suatu situasi, dia memberi kita contoh yang jelas
Ibunya bangga padanyaJadi, kita mengusulkan kasus berikut: “Bayangkan kita memiliki album foto beberapa teman yang merayakan ulang tahun di sebuah Pub. Beberapa gambar pertama menunjukkan orang memesan bir dan meminumnya, sedangkan gambar terakhir menunjukkan seseorang tertidur di sofa”, komentarnya.
Sistem konvensional “dapat dengan mudah menunjuk ke sesuatu seperti ada orang yang berbaring di sofa, sementara sistem kami dapat memasukkan bahwa mereka mungkin berada dalam situasi itu karena mereka mabuk setelah minum sedikit ” . Tambahan yang memberikan pengertian dan muatan emosional tertentu yang juga tercermin melalui gambar dan keterangan foto yang disertakan dalam artikel ini.
Via | Tinjauan Teknologi MIT
Di Xataka Windows | Microsoft meluncurkan aplikasi yang menentukan ras anjing Anda