Zgłoś błąd
X
Zanim wyślesz zgłoszenie, upewnij się że przyczyną problemów nie jest dodatek blokujący reklamy.
Błędy w spisie treści artykułu zgłaszaj jako "błąd w TREŚCI".
Typ zgłoszenia
Treść zgłoszenia
Twój email (opcjonalnie)
Nie wypełniaj tego pola
.
Załóż konto
EnglishDeutschукраїнськийFrançaisEspañol中国

Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbka

Natan Faleńczyk | 30-03-2024 20:30 |

Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbkaDzisiejsza technologia związana z AI to nie tylko chatboty i generatory obrazów lub filmów, ale także możliwość sklonowania praktycznie dowolnego głosu. Na rynku co prawda istnieje już wiele takich rozwiązań, natomiast organizacja OpenAI zaprezentowała właśnie model Voice Engine, który pozwala uzyskać imponujące efekty. Może on utworzyć bardzo realistyczny głos konkretnej osoby — w tym celu wystarczy mu zaledwie kilkunastosekundowa próbka.

OpenAI pokazało próbkę możliwości swojego modelu Voice Engine, który pozwala na zamianę tekstu na mowę z użyciem dowolnego głosu źródłowego. Organizacja chce jednak odpowiedzialnie podejść do tematu, więc rozwiązanie nie jest jeszcze publicznie dostępne.

Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbka [1]

Model GPT-4 od OpenAI został zdetronizowany. Użytkownicy wybrali następnego króla, którym jest nowość od Anthropic

Model Voice Engine jest rozwijany już od dłuższego czasu, natomiast teraz OpenAI postanowiło przedstawić jego możliwości. Trzeba przyznać, że uzyskiwane efekty są dosłownie rewelacyjne. Wspomniana 15-sekundowa próbka wystarcza nie tylko do tego, aby sklonować barwę głosu. Na jej podstawie można odwzorować różne emocje, a także zmieniać tempo mowy. Wszystko to składa się na bardzo realistyczny głos, który w niczym nie przypomina dawnych syntezatorów mowy. Przykłady pokazane przez OpenAI na tej stronie ukazują, że sklonowanym głosem można odczytywać teksty w innym języku i to z zachowaniem czyjegoś akcentu. Umożliwia to choćby płynne tłumaczenie filmów. Kolejnym pożytecznym wykorzystaniem Voice Engine jest pomoc dla osób, które z jakiegoś powodu nie mogą się normalnie i swobodnie wypowiadać. Można bowiem użyć krótkiej próbki głosu sprzed wypadku.

Voice Engine - technologia od OpenAI pozwala na realistyczne klonowanie głosu. Wystarczy zaledwie krótka próbka [2]

Stable Diffusion stworzy grafikę w ułamku sekundy. Badacze z MIT przedstawili metodę, która usprawni każdy model AI

Oczywiście omawiane rozwiązanie niesie za sobą równie wiele, a może nawet więcej zagrożeń. OpenAI zdaje sobie z tego sprawę, więc zamierza najpierw przedyskutować to, w jaki sposób można rozważnie wprowadzić tę technologię na szerszą skalę. Do tego w każdym nagraniu, które zostanie stworzone przy użyciu Voice Engine, zaimplementowany zostanie znak wodny. Ma to pozwolić na łatwą identyfikację źródła. Aktualnie tylko garstka wybranych osób uzyskała dostęp do tego modelu, a dopiero po wprowadzeniu wspomnianych środków bezpieczeństwa trafi on na rynek. Jest to bardzo dobre podejście, wszak już teraz wiele podobnych rozwiązań przyczyniło się do szerzenia dezinformacji. Świat zmienia się nie do poznania i z jednej strony jest to fascynujące, natomiast z drugiej dosłownie przerażające.

Źródło: OpenAI
Bądź na bieżąco - obserwuj PurePC.pl na Google News
Zgłoś błąd
Liczba komentarzy: 40

Komentarze:

x Wydawca serwisu PurePC.pl informuje, że na swoich stronach www stosuje pliki cookies (tzw. ciasteczka). Kliknij zgadzam się, aby ta informacja nie pojawiała się więcej. Kliknij polityka cookies, aby dowiedzieć się więcej, w tym jak zarządzać plikami cookies za pośrednictwem swojej przeglądarki.