Klavye? Ne kadar tuhaf

Sesli arama ve sesle çalışan yazılımlar devri üzerimizde. Bir geliştirici olarak klavyeyle yaşıyorum ve ölüyorum, ancak işaretleri şimdiden görebiliyorum: Birçok kişi gibi, örneğin, Android telefonumla konuşuyorum (örneğin, "Lowes'a [veya Starbucks veya Harris Teeter'e git]") Yol tarifi almak.

Mary Meeker'in 2016 İnternet Trendleri Raporunda, Google Voice arama sorgularının 2010'dan bu yana yedi kat arttığını bildirdi. Ayrıca, 12 yaşındaki oğlumun neredeyse tüm aramalarını sesli olarak yaptığını fark ettim. kız arkadaşım düzenli olarak bana bu şekilde mesaj atıyor. Ayrıca, çalıştığım şirket Lucidworks, Watson ve metin okuma yeteneklerini kurumsal arama ürünümüze entegre etmek için yakın zamanda IBM ile yeni bir ortaklık duyurdu. 

Teknoloji, eskisinden çok daha iyi çalışıyor ve uygulamalara entegre edilmesi daha kolay. Android veya iOS için geliştirme yapıyorsanız, konuşma tanıma için API'lara kolayca bağlanabilirsiniz. Ancak konuşma tanıma, basit konuşmadan metne ve sesli komutlarla başlamaz ve bitmez.

Aramanın amacını anlamak, özellikle konuşma dilinde çok bağlamsal bir görevdir. Dahası, insanlar doğal konuşma dilinde, bir arama çubuğuyla karşılaştıklarından daha fazla kelime kullanma eğilimindedir. Normal bir metin aramaya göre konuşma dilinde daha fazla "gürültülü kelime" vardır.

Bunlar, önemli AI zorluklarıdır. Ancak bağlam sorununun üstesinden geldiğimizde, geliştiriciler metinden çok sesle yapılabileceğini öğrenecekler. Duygusal bağlam bir rol oynayacaktır. Bir benzin istasyonu arıyorsanız, en ucuzunu mu yoksa en yakınını mı istersiniz? Sesinizin duygusal içeriği bunu ima edebilir. Elbette, açıklığa kavuşturabilirsiniz, ancak zorunda kalmayabilirsiniz.

Konuşkan geleceğin

Sese dayalı dönem, yalnızca arama ile ilgili değildir. Bilgisayarlarla tüm etkileşim şeklimizi etkileyecektir. Scotty'nin "Star Trek IV" te tanımladığı gibi, çok da uzak olmayan bir gelecekte klavyeler "antika" olarak kabul edilecek.

Ancak bu değişim aynı zamanda tamamen yeni bir kullanıcı arayüzü gerektiriyor. İşte ne demek istediğimin eski bir örneği: Windows 95 çıktığında IBM, bilgisayarlarına sesli komutlar entegre etmişti. O zamanlar Office Depot'ta satış elemanı olarak çalışıyordum ve sesli komutların ne kadar pratik olmadığı kısa sürede anlaşıldı. Pencereli arayüz, bu etkileşim biçimine hiçbir şekilde izin vermedi.

Demek istediğim, sesli komutlarla bir pencereyi başka bir pencerenin önünden nasıl çıkarır ve her ikisini de ekrana sığacak şekilde verimli bir şekilde yeniden boyutlandırırsınız? Yapmıyorsun. Bu pencereleri (ve muhtemelen pencereleri) tamamen atarsınız. Sesle çalışan bir kullanıcı arayüzü aynı motifleri kullanmaz. "Star Trek" te pencereli bir arayüz asla görmezsiniz.

"Star Trek" demişken, insanlar kodlamaya veya teknik bir şey yapmaya başladıklarında, her zaman dokunsal bir arayüze geçerler (Tamam, tam olarak dokunsal değil - daha çok, bir devre kartının art nouveau görüntüleriyle kaplanmış bir mikrodalga klavyeye benziyor). Ama "yazmaya" gerileme gerekli midir? Doğru, Scala'da kod yazmak için bir ses arabirimi kullanmayı hayal edemiyorum. Belki de özellikle ses için uygun olan yeni diller (Scala'nın aksine parantez içermeyen - ve makalelerim) geliştirilecektir.

Web siteleri kesinlikle aynı görünmeyecek ve yeni gezinme paradigmaları sunacak. "Bana ayakkabılarla ilgili fırsatları göster" diyeceksiniz ve geri aldığınız şey muhtemelen ortalama web sitenizden ("fırsatlar" ve "ayakkabılar") daha iyi organize edilmiş ve bağlamsal olarak daha hassas olacaktır. Dahası, çok fazla kaydırmak veya "sonraki sayfa" demek istemiyorum, bu nedenle etkileşimlerin kişiselleştirilmesi gerekecek. Sistem zaten erkek ayakkabıları istediğimi bilmeli ve Aşil tendinitimden dolayı sert topuklu ayakkabılar istemiyorum. Belki koyu renkleri tercih ettiğimi biliyordur. Belki söyledim ya da belki davranışımı analiz etti.

Bu bir web sitesi mi? Elbette, eğer ayakkabı alışverişi yapıyorsam, görsel bir sunum isteyeceğim ama eğer konuşursam belki makine cevap veriyordur. Belki bana ayakkabıları gösterir ve sonra sorar: "Belirli bir ayakkabı türü mü arıyorsunuz? Bu ayakkabılar ne amaçla? Onları yürüyüşe mi yoksa bir partiye mi giyiyorsunuz?"

Sesli arama çağı, makinelerle nasıl etkileşim kurduğumuzdan kodlama şeklimize kadar her şeyi değiştirecek. İhtiyaç duyduğumuz teknolojilerin çoğu bugün bizim için zaten mevcutken, diğerleri henüz icat edilmedi. Kullanıcı arayüzleri üzerindeki etki, delikli kartlardan klavyelere geçişten daha derin olabilir.

Bu kapsamlı değişiklik bir anda olmayacak. Bugün klavyenizi atmanın günü değil. Ancak, web sitenizi gerçekten sesle erişilebilir olacak şekilde yeniden tasarlamayı düşünmeye başlamanın günü olabilir.