Wyszukiwanie i Generowanie Próbek Audio

Wewnętrzny produkt firmowy. Tekst lub obraz na wejściu — wysokiej jakości dźwięk na wyjściu.

„Opisz dźwięk słowami — a my go stworzymy. Pokaż obraz — a my usłyszymy, co się w nim dzieje." — koncepcja produktu

O projekcie

Potrzebujesz dźwięku deszczu do filmu. Albo szumu oceanu. Albo czegoś zupełnie unikalnego, czego jeszcze nie ma. Skąd to wziąć? Szukać w bibliotekach dźwięków i płacić za licencje? Nagrywać samodzielnie, tracąc czas i pieniądze na sprzęt? Płacić realizatorowi dźwięku za każdą próbkę? Nasz wewnętrzny produkt rozwiązuje to zadanie w inny sposób: opisujesz dźwięk słowami — my go generujemy. Pokazujesz obraz — tworzymy dźwięk, który do niego pasuje. Wszystko przez proste API, bez skomplikowanych ustawień i bez szczegółów technicznych. Po prostu opisz, czego potrzebujesz, i otrzymaj wynik. Produkt już działa i jest aktywnie wykorzystywany w naszych projektach. Wynik często trafia w punkt za pierwszym razem — nie trzeba dobierać parametrów, nie trzeba tłumaczyć szczegółów technicznych. System rozumie język naturalny i tworzy to, co opisałeś.

Galeria (wide)

Jak to działa

Zasada jest prosta: łączysz się z API raz, konfigurujesz integrację, a potem po prostu wysyłasz opis — tekst w języku naturalnym lub obraz. Otrzymujesz próbkę audio o różnej długości, w zależności od zapytania. Wysoka jakość dźwięku, różne formaty eksportu, metadane o wygenerowanym dźwięku — wszystko to działa automatycznie. System rozumie opisy w rodzaju „cichy deszcz w lesie, krople spadające na liście" i tworzy dokładnie taki dźwięk. Pokazujesz zdjęcie oceanu — otrzymujesz dźwięk fal pasujący właśnie do tego obrazu. API wykorzystuje architekturę REST i zwraca wyniki w formacie JSON — po prostu wysyłasz zapytanie i otrzymujesz plik.

Dwa obrazy (block two)

Zastosowania

To narzędzie znajduje zastosowanie w najróżniejszych dziedzinach. Do tworzenia oprawy dźwiękowej filmów, podcastów, prezentacji — każdy typ treści potrzebuje dźwięku, a teraz można go uzyskać w sekundy. Do generowania muzyki tła — unikalne kompozycje dopasowane do twoich projektów, wolne od problemów licencyjnych i długich negocjacji z właścicielami praw. Do prototypowania pomysłów audio — szybko sprawdź koncepcję przed zainwestowaniem w pełną produkcję. Do tworzenia unikalnych efektów dźwiękowych — dźwięki, których jeszcze nie ma, dla gier, filmów, instalacji. Wszystko to staje się dostępne przez proste API, bez konieczności opanowywania skomplikowanych narzędzi nagraniowych.

Trzy obrazy (block three)

Technologie

Projekt wykorzystuje własne modele generatywne, trenowane na dużych zbiorach danych. API do integracji umożliwia prostą integrację z dowolnym projektem — raz skonfigurowane, dalej po prostu używane. Wysoka szybkość generowania oznacza wyniki w sekundy. I ciągłe doskonalenie jakości i różnorodności — system staje się lepszy z każdym użyciem.

Szeroki obraz

Technologia generowania

Status projektu

To usługa biznesowa, która działa i jest aktywnie używana wewnątrz firmy w różnych projektach. Nawet biorąc pod uwagę, że wiele modeli generujących dziś wideo potrafi już robić to z dźwiękiem, odrębna usługa do generowania dźwięków na żądanie pozostaje bardzo fajną inicjatywą. Na razie nie planujemy wypuszczać jej „na zewnątrz" jako usługę publiczną. Jeśli jest zainteresowanie — piszcie. Rozważamy warianty pilotaży z zewnętrznymi zespołami, gdy format i granice pasują.

Dalej

Modelowanie Przestrzeni

Cyfryzacja przestrzeni przy użyciu technologii LiDAR. Modele 3D dla bezpieczeństwa pożarowego, logistyki magazynowej i analityki biznesowej.

→