Asystent głosowy Siri posługuje się obecnie dwudziestoma czterema językami. Wraz z premierą iOS 10.3 otrzyma on również wsparcie dla szanghajskiego (zwanego również wu). W wywiadzie dla agencji Reuters Alex Acero udzielił kilku informacji na temat tego, jak Siri uczy się nowych języków.

Alex Acero pracuje w Apple na stanowisku dyrektora do spraw rozwoju asystentów głosowych. Pierwotnie Siri bazowała na technologii stworzonej przez firmę Nuance, ale kilka lat temu Apple zastąpiło ją autorskim rozwiązaniem. Pozwoliło to na implementację mechanizmu uczenia maszynowego, co zwiększyło możliwości rozpoznawania wypowiadanych przez użytkowników wyrazów.

Pracę nad nauczeniem Siri nowego języka rozpoczynają się od rozpoczęcia współpracy z osobami, które się nim posługują. Ważne jest, aby różnili się oni między sobą akcentem oraz dialektem, który wyróżnia sposób, w jaki mówią.

Zaproszone przez Apple osoby muszą przeczytać różne zdania oraz wyrazy, które są nagrywane. Po dokonaniu transkrypcji zapisanych wypowiedzi gotowe materiały są implementowane do specjalnego oprogramowania, które je analizuje.

Sztuczna inteligencja stara się na podstawie danych, którymi dysponuje, przewidzieć, jak należy wymówić dany wyraz. Problemem mogą być tutaj takie wyrazy jak „zamarznięty”, które trzeba z oczywistych względów skorygować.

W następnym kroku Apple przygotowuje funkcję dyktowania wyrazów. Jest ona od dłuższego czasu dostępna w języku polskim – zarówno w przypadku systemu iOS, jak i macOS. Pozwala to firmie z Cupertino na zbieranie anonimowych próbek dźwięku, których autorami są przede wszystkim osoby, które bardzo dobrze znają dany język.

Nagrania są oczywiście dalekie od perfekcji – charakteryzują je szumy, chrząknięcia, przerywania, jąkanie się i wiele innych czynników, które pogarszają jakość próbki. Dlatego też jest ona ręcznie dostosowywana przez Apple w taki sposób, aby można ją było zaimplementować sztucznej inteligencji. Proces zbierania nagrań trwa tak długo, aż zostanie zebrana odpowiednia ilość materiałów pozwalających na aktywowanie Siri w danym języku.

Na koniec wywiadu Acero dodał, że Apple analizuje to, o co ludzie pytają Siri i co dwa tygodnie aktualizuje swoją bazę w taki sposób, aby udzielane przez asystenta odpowiedzi były jak najlepsze. Kiedy doczekamy się dnia, w którym zacznie on mówić po polsku? Tego niestety jeszcze nie wiadomo, ale jak wynika z wywiadu, cały proces mogą zdynamizować sami użytkownicy wykorzystując funkcję dyktowania.

Źródło: 9TO5MAC