Shutterstock
Technologia

Śpiewa ptak czy AI? Coraz trudniej stwierdzić

Niemal idealnie naturalnie brzmiące syntetyczne dźwięki stworzyli dzięki generatywnym modelom percepcji badacze z Massachusetts Institute of Technology i Harvard University.

Brzęk monet, śpiew ptaków, czy szelest papieru – to dźwięki, które człowiek identyfikuje bez kłopotu. Na pozór mogą one wydawać się proste, ale dla maszyn ich wierne zrozumienie i odtworzenie jest skomplikowanym procesem. Naukowcy stworzyli algorytmy głębokiego uczenia, które mają zdolność ich rozpoznawania. I odtwarzania.

Kluczowym celem naukowców było sprawdzenie, czy syntetyczne dźwięki generowane przez algorytmy mogą być rozpoznawane przez ludzi jako autentyczne. Do tej pory trudno było odtwarzać tak chaotyczne, zmienne dźwięki jak te, które wydaje bilon, jednak modele opracowane przez zespół sobie z tym poradziły. Dźwięki utworzone podczas tego badania były tak realistyczne, że uczestnicy eksperymentów często mieli trudności z odróżnieniem ich od rzeczywistych nagrań. Kluczem do sukcesu okazały się generatywne modele percepcji. Funkcjonują one jak wewnętrzny system, który próbuje odgadnąć, co dokładnie wywołuje dane sygnały dźwiękowe. Na przykład, gdy algorytm usłyszy brzęczenie monet, analizuje, jakie dokładnie ruchy nimi były wykonane, w jaką powierzchnię mogły uderzać i z jaką siłą. To pozwala stworzyć syntetyczne dźwięki, które niemal nie różnią się od tych prawdziwych.

Sięgnij do źródeł

Listening with generative models

Uzyskane wyniki są imponujące, jednak opisane algorytmy mają też swoje ograniczenia. Modele nadal mogą napotkać trudności przy dźwiękach bardziej złożonych i subtelnych, co oznacza, że przed badaczami wciąż stoi wiele wyzwań.

Mimo to przyszłe zastosowania tych technologii mogą być bardzo szerokie – od udoskonalenia systemów rozpoznawania mowy, przez lepsze algorytmy redukcji szumów, aż po użycie w branży rozrywkowej, w której wierne odwzorowanie dźwięków jest kluczowe dla realistycznych doświadczeń w filmach i grach.


Dziękujemy, że jesteś z nami. To jest pierwsza wzmianka na ten temat. Pulsar dostarcza najciekawsze informacje naukowe i przybliża najnowsze badania naukowe. Jeśli korzystasz z publikowanych przez Pulsar materiałów, prosimy o powołanie się na nasz portal. Źródło: www.projektpulsar.pl.

Ta strona do poprawnego działania wymaga włączenia mechanizmu "ciasteczek" w przeglądarce.

Powrót na stronę główną