AI Technology26.09.2025 г.8 мин четене

Suno v5: Впечатляваща AI музика, но без душа

Когато не се опитва да се защити от съдебни дела от големи музикални компании, Suno продължава да усъвършенства своя инструмент за създаване на музика с изкуствен интелект. Последният модел, Suno v5, е очевидно техническо подобрение спрямо предишната версия v4.5+. Въпреки това, той все още не може да избяга от бездушната празнота, която пронизва повечето произведения на изкуствения интелект.

Има някои общи подобрения в качеството на звука, които са неоспорими, като по-малко артефакти и по-ясно разделение между инструментите. Някои песни, създадени с v4.5+, могат да смесват всички мелодични части по начин, при който линиите между китара, бас и синтезатор са размити в най-добрия случай. Но с v5 миксовете са много по-чисти.

По време на демонстрация, Хенри Фипс, продуктов мениджър на Suno, посочи песен, която моделът генерира, включваща синтезатор, наподобяващ флейта, с ефект на забавяне, подобен на пинг-понг: „Никога не съм чувал това в предишни модели... което ми казва, че моделът разбира, че това е изолиран звук, който трябва да бъде възпроизведен вярно в различни части на стерео полето.“ Тъй като Suno всъщност не прилага ефекти по традиционния начин, това означава, че моделът идентифицира определен инструмент и приблизително възпроизвежда звука на стерео забавяне, защото е решил, че така трябва да звучи.

Няма остри ръбове в нито един от вокалите на Suno. Всичко е обляно в реверберация, наслоено с хармонии и перфектно в тон. Дори ако изрично му кажете да не прави тези неща, моделът просто ви игнорира.

Suno също твърди, че v5 има по-добро разбиране на жанра, въпреки че това твърдение изглежда съмнително от моите тестове. С някои от моите подканвания като „модерен авант R&B с гличи, но фънки барабани, атмосферни мелодични части и дишащи вокали,“ нито v5, нито v4.5+ изглеждаха като ясен победител в доставянето на това, което имах предвид (главно Kelela’s Take Me Apart). И двата модела се доближиха, давайки ми даунтемпо тракове с някои мрачни синтезатори, но им липсваше странността, която очаквах.

Нито Suno успя да разбере какво търся с „ранен ‘90s lo-fi инди рок, записан на 4-траков касетофон с фалшиви вокали и леко разстроени китари,“ но v5 определено беше по-далеч от целта. Въпреки всичко, което опитах, не можах да накарам Suno да създаде нещо, което да звучи дори отдалечено като Pavement. Свободният, небрежен шумов поп, който свързвам със Slanted and Enchanted, липсваше. Вместо това получих бомбастичен „инди“ рок с тежки рифове и чисти, мощни акорди. Suno v5 продължаваше да предлага песни, които звучаха повече като Arctic Monkeys, отколкото нещо издадено преди началото на века.

По същия начин, в моите тестове, v5 изглеждаше, че се затруднява с подканвания, свързани с определени епохи или десетилетия. Когато поисках „края на 1970-те краутрок,“ v4.5+ почти го уцели извън вокалите (повече за това по-късно). Но v5 често доставяше синтпоп от 80-те и тракове, които звучат по-модерно, дори и да имат някои от класическите краутрок ДНК.

Това, което ще кажа, е, че аранжиментите, които Suno v5 създава, са много по-сложни. В сравнение с v4.5+, има повече уникални музикални украшения, които предотвратяват прекалената повторяемост и по-разнообразни структури на песните. Докато v4.5+ обикновено се задоволява с основна структура куплет-припев-куплет (с мост добавен за добър ефект), v5 често има предварителни или последващи припеви, множество мостове или прекъсвания и обикновено изгражда трака, предлагайки повече дъга, отколкото просто отделни секции.

Той също така понякога доставяше интересни резултати при ремиксиране на съществуващи тракове. Качих песен от EP, което издадох преди няколко години (което вероятно трябваше да задейства филтъра му за авторски права) и, няма да лъжа, донякъде ми хареса как превърна части от китарното ми соло в повтарящ се синтезаторен мотив и превърна големите ми акорди в движещи се арпежи.

Но това, което липсваше във всички тези кавъри на моята песен, които поисках Suno да създаде, беше суровата, lo-fi природа на трака, който записах в хола си в 3 часа сутринта преди около шест години. И това е нещо като основна тема тук. Докато Suno може да имитира някои от повърхностните черти на стар запис или човешко изпълнение като шум от лента или вдишвания, винаги се чувства неавтентично.

Фипс признава, че не е чул вокалният модел да възпроизвежда уникалните несъвършенства на истинско човешко изпълнение. В ранните си съобщения за v5, Suno рекламираше своите „емоционално богати вокали“ и „човекоподобна емоционална дълбочина,“ но тази фраза вече липсва от всички публични материали. Вместо това, компанията сега избира да описва вокалите като „естествени, автентични,“ като обяснява промяната като „стилистичен избор.“

Но дори това изглежда като преувеличение. Да, в сравнение с v4.5+ вокалите се усещат по-човешки, но все още са сковани. Фипс обясни, че „когато възприемаме вокал от Suno [v4.5] като емоционално плосък, мисля, че това е защото просто липсва някакъв детайл, който му придава този ръб,“ и че по-високата вярност на модела v5 доставя този детайл.

Трудно е да се спори с техническите аспекти на това твърдение — вокалните изпълнения са по-подробни — но все още са болезнено общи. Всеки рок вокал в крайна сметка звучи като Imagine Dragons или Mumford and Sons, всяка R&B песен като сънлива Adele или безчарна Ariana Grande.

Няма остри ръбове в нито един от вокалите на Suno. Всичко е обляно в реверберация, наслоено с хармонии и перфектно в тон. Дори ако изрично му кажете да не прави тези неща, моделът просто ви игнорира. Поисках от v5 „необработено емоционално соло а капела женско вокално изпълнение без реверберация, без хармонии, без ефекти, само сухи вокали.“ Двете песни, които достави, бяха обляни в реверберация, включваха допълнителни вокалисти, които хармонизираха с първия, и една дори имаше нещо, което звучеше като бас съпровод. (Въпреки че може би беше глас, който приблизително възпроизвежда бас.) Но Фипс не беше изненадан. „Моделите все още не разбират описания на специфични ефекти и техники на запис. Начинът, по който се изпълнява вокалът, е най-вече повлиян от текста и общото настроение,“ каза той.

Затова подадох на Suno текстове, които бяха достатъчно различни от „Gimme Shelter“ на Rolling Stones, за да избегна флаг за нарушение на авторски права. На пръв поглед изглеждаше, че има всички елементи, които правят оригинала толкова опустошителен. Мощна женска вокалистка, която крещи над пълно, блусово аранжиране, но имаше цялото емоционално въздействие на учебник по стоматология.

Когато слушам „Gimme Shelter,“ това е начинът, по който гласът на Мери Клейтън се разпуква, докато изпълнява „изнасилване и убийство“ по време на моста, което ме кара да се задавя. Това е напълно фалшивото трептене на Робърт Смит, което предава отчаянието в „Why Can’t I Be You“ и осезаемото изтощение в дъха на Кърт Кобейн точно преди да изпълни последния ред в „Where Did You Sleep Last Night,“ което ви казва, че това е човек, който се бори с истински демони.

Като цяло, опитите да накарам Suno да звучи „лошо“ — фалшиво, сурово, извън тон, небрежно — бяха безплодни. Въпреки всички разговори на компанията за това колко „естествени“ звучат новите вокали на модела, му липсват несъвършенствата, които често носят емоционалната тежест на изпълнението. Виртуалните вокалисти на Suno все още звучат откъснати. Модел v5 може да разбере, че определен текст трябва да бъде тъжен, но няма никаква действителна емоционална връзка с думите, защото е купчина код, а не артист.

Повече AI новини и услуги:

AI Новини | AI Услуги | Начало