2019 Yılının Geliştiriciler için En İyi Açık Kaynak Ses Kontrollü Yardımcı (Linux, Raspberry Pi, Windows ve Mac OS X)

Sesli yardımcılar veya kişisel sesli yardımcılar, kullanıcı komutunda belirli görevleri gerçekleştirmek için doğal dil işleme (NLP) ve konuşma sentezi kullanan programlardır. Günümüzde akıllı telefonlarımızın büyük bir kısmı, son birkaç yıldır bilgisayar, iPhone kullanıcısıysanız kesinlikle Siri kullanıyorsunuz veya bir android kullanıcısıysanız, google asistanınızı tanıyorsunuz.

Sesli yardımcılar son birkaç yıldaki büyük oyuncular tarafından Apple, Microsoft, Amazon, Google ve Facebook (2018 başlarında kişisel yardımcıyı kapatma) olarak serbest bırakılmıştı. Şimdi bireylere kendi kişisel yardımcılarını geliştirme ve akıllı evlerinde uygulama seçeneği sunan açık kaynaklı projelerimiz var.

Sesli yardımcı ve akıllı yardımcı arasındaki fark nedir?
Akıllı yardımcı, kullanıcının görevleri yerine getirmesine yardımcı olmak için oluşturulmuş bir programdır. Genellikle doğal dil işleme ve yapay zeka kullanır.Bununla birlikte, sesli yardımcı akıllı bir yardımcıdır ancak ses tanıma teknolojisini kullandığı için doğal dil işleme ile birlikte konuşma sentezi (NLP) de kullanılır.

Sesli Yardımcı nasıl çalışır?
Sesli yardımcı, “Tamam Google”, “Hey Siri”, “Alexa” ve “Hey Cortana” olarak belirli bir anahtar kelimeye yanıt verir, daha fazla talimat veya görevi beklemesi için yardımcısı etkinleştirmek gerekir.

Sesli yardımcıları  AI (Yapay Zeka)’nın günlük rutininize ile bütünleşmiş olan bir üretimdir, Kullanıcı seslerini tanıyacak kadar akıllıdır ve bazıları makine öğrenmesi algoritmalarına dayanan karmaşık görevleri gerçekleştirmek için üretilmiştir.


Hangi ses yardımcısı yapabilir?

  • Not almak
  • Bir takvim oluşturur
  • Rezervasyon randevuları
  • Telefon görüşmesi
  • İnternette arama yapmak
  • Hatırlatıcı oluşturma
  • Rezervasyon yap
  • Bir konum arayın
  • Notları, kitapları ve makaleleri okuma
  • …. ve dahası.

Açık kaynaklı ses yardımcıları. Niye ya?

Açık kaynaklı teknolojiler yaratıcılara, yeni başlayanlara ve geliştiricilere kendi tüketici ürünlerini oluşturmaları için esnek seçenekler sunar. Bu, geliştiricilerin deneme yapmasını, kullanılabilirliği başka bir alana genişletmesini ve sektör odaklı ürünler oluşturmasını sağlar.

1- Mycroft

Mycroft , Linux makineleri için üretilmiş açık kaynaklı bir ses yardımcısıdır ve Linux masaüstlerine ve Raspberry Pi’ye kurulabilir. Mycroft, verilerinizi toplayıp paraya dönüştürmeyen bir gizlilik odaklı.

Mycroft Mark 1
Mycroft Mark 1

Mycroft AI, geliştiricilere gelişmiş bir prototip olarak amaçlanan Mycroft özellikli cihaz olan Mycroft Mark 1’i piyasaya sürdü, Mycroft Mark II , (Aralık 2018), son kullanıcılar için tüketiciye hazır bir konuşmacı oldu.

Mycroft Mark II
Mycroft Mark II

 

Mycroft, Linux tabanlı cihazda Mycroft kullanarak kendi ürünlerini oluşturmak için geliştiricilere belgelendirme sağladı; böylece geliştiriciler Raspberry Pi ile değil, Linux için hazır olan herhangi bir makine ve tek kartlı bilgisayarla sınırlı kalmadı.

Şu anda, Mycroft’un Windows ve Mac OSX için desteği yoktur.

  • Platformlar: Linux, Raspberry Pi
  • Geliştirici dostu: evet
  • Gelişim durumu: aktif, topluluk temelli

2- Kalliope

Kalliope , özellikle ev otomasyonu için tasarlanmış, açık kaynaklı, modüler tabanlı, ses kontrollü, kişisel bir yardımcıdır. Linux, Raspberry Pi ve Android telefonlarda çalışmak üzere inşa edilmiştir.

Kalliope güçlü, geliştirici dostu dokümantasyon, API ve araçlara sahip geliştiriciler için üretilmiştir.

Kalliope Android istemcisi - src
Kalliope Android istemcisi – src

Kalliope Tanıtım

Kalliope pazar ekosistemi.
Kalliope modüler bir yapı üzerine inşa edildiğinden, cevabı tetikleyen sinyaller, belirli eylemleri gerçekleştirmek için eklentiler olan Nöronlar için bir pazar yeri vardır. Nöron pazarında, topluluk geliştiricileri tarafından temel nöronları ve topluluk nöronları bulunur.

Daha fazla geliştirici araç:

  • Kalliope REST API’sı
  • Kalliope ses yardımcısı etkileşimli kabuk
  • Kalliope Web Kullanıcı Arayüzü
  • Kalliope android uygulaması

Platformlar : Linux / RaspberryPi ve Android

3- Stephanie

Stephanie , özellikle ses kontrollü uygulamalar için oluşturulmuş, sanal yardımcının çalışmalarının çoğunu taklit eden günlük görevleri otomatikleştiren açık kaynaklı bir platformdur.

Stephanie ses yardımcısı, son kullanıcı ve geliştiricilerin kurulumu, yapılandırması ve kullanması için tasarlanan zengin belgelendirme ile birlikte MIT lisansı altında yayınlandı. Geliştiriciler kendi modüllerini yaratarak kolayca genişletebilirler.

Stephanie belgeleri – src

 

Stephanie kodu yaklaşık 700 kez izlendi ve yaklaşık 100 kez çatallandı.

Platform: Linux, Windows ve Mac OSX
Geliştirici arkadaş: evet
Geliştirme durumu: kararlı
Topluluk: Slack
Lisans: MİT

4-Open Assistant

Açık Yardımcı , açık kaynaklı bir kişisel yardımcıdır. Gösteri videosunda olduğu gibi konuşma açısından zengin bir iletişim kutusundaki ses komutlarına yanıt verir.Prototip aşamasında uzun süredir var, ancak geliştiriciler tarafından takip edilmeyi ve birçok kez çatallaşmayı başardı.

Open Assistant’ın kurulumu kolaydır, ancak geliştirici belgelerine sahip değildir.Sadece bir tane temel geliştirici olduğu göz önüne alındığında, proje halen aktif gelişme içerisindedir.

Platformlar: Windows, Linux ve MacOSX

5- Dragonfire

Dragonfire , Ubuntu-Linux dağıtımları için özel olarak oluşturulmuş bir sanal yardımcıdır. Google Play mağazasına yüklenebilecek bir Android istemcisi sağlar.

Dragonfire ses komutlarınızı anlamak için Mozilla DeepSpeech’i ve metinden konuşmaya olan görevleri yerine getirmek için (Festival Speech Synthesis System) Festival Konuşma Sentez Sistemi’ni kullanır.

  • Platform: Linux (KDE neon, temel işletim sistemi, Ubuntu)
  • Dil desteği: İngilizce

Dragon Fire Tanıtım

6- Jasper

Jasper , ses yardımcısı oluşturmak ve uygulamayı ses asistanı özellikleriyle genişletmek için açık kaynaklı bir platformdur. Ancak, 

şimdiye kadar Raspberry Pi odaklı.

Jasper, MIT lisansı altında yayınlandı, zengin belgelendirme  ve uygulama oluşturmak için geliştirici dostu API sunuyor.

Platform: Raspberry Pi ve Linux

7- Jarvis

Jarvis açık kaynaklı bir yardımcıdır, bu adı Demir Adam filminden hatırlıyorsunuzdur. Linux, Mac OSX ve Windows terminallerinden kurulabilir ve çalıştırılabilir. Modüler bir yapıya sahiptir. Ses yardımcısı özelliklerine sahiptir. Yine de proje hala aktif gelişme içinde. Esas olarak mevcut durumdaki geliştiriciler ve ileri düzey kullanıcılar için.

Platformlar: Linux, Mac OSX ve Windows

8- Linto

Linto , iş için yapılmış açık kaynaklı bir ses yardımcısıdır. Toplantı görevlerini otomasyona odaklar. Linto, geliştiriciler, akıllı hoparlörler üretir ve masa telefonu donanımının yerini alacak kişiselleştirilebilir bir platform sağlamayı amaçlayan açık kaynaklı bir cihaza sahiptir.

Linto ekibi tüm araçlarını GitHub’da açık kaynak olarak yayınladı. Henüz yayınlanmış merkezi bir belgelendirmesi yoktur.

9-Jovo

Jovo , Amazon Alexa ve Google Assistant’ın üzerine sesli uygulamalar geliştirmek için açık kaynaklı bir platformdur. Bir kod tabanıyla, geliştirici kendi uygulamalarını yaratabilir ve kolaylıkla uygulayabilir.

Jovo, geliştiricilere açık kaynak araçları olarak ihtiyaç duydukları her şeyi sağlamıştır. Uygulamanın üretimini kolaylaştırmak için bir dizi geliştirme aracıyla özel özellikler ve eklentiler içeren bir işletme ücretli planı vardır.

Platform: Google Asistan ve Amazon Alexa

10-Hey Athena

Hey, Athena ücretsiz bir açık kaynaklı modüler ses yardımcısı çerçevesidir.Geliştiriciler için inşa edilmiştir. Ancak, Hey Athena web sitesi kapalı, dokümantasyon ve kod yaklaşık bir yıldır güncellenmedi, proje kodu geliştiricilere açık olmasına rağmen.

Proje tanımı: bir çerçeve


Not : Bu makale bir Evergreen makalesidir. Listelenen uygulamaların sürekli güncellemelerini alır. Kaydedebilir ve güncellenmiş bir kaynak olarak geri dönebilirsiniz.

Kaynak: Medevel