Бесплатная нейросеть преобразования текста в видео Zeroscope с открытым исходным кодом
Zeroscope - это новая нейросеть для трансформации текста в видео с открытым исходным кодом. Она базируется на основе модели Modelscope, но имеет более высокое разрешение и соотношение сторон 16:9. Zeroscope представлен в двух версиях и использует смещенный шум для улучшения распределения данных, что позволяет создавать разнообразные и реалистичные видеоролики.
Zeroscope основан на Modelscope и вносит значительные усовершенствования. Благодаря повышенному разрешению и соотношению сторон 16:9 Zeroscope обеспечивает лучший и профессиональный опыт создания видео. Zeroscope поставляется без ограничений по содержанию и отсутствию водяных знаков.
Модель Zeroscope_v2 доступна в двух версиях: Zeroscope_v2 567w, оптимизированной для создания контента с разрешением 576x320 пикселей и Zeroscope_v2 XL, которая увеличивает разрешение видео до 1024x576 пикселей. Меньшая версия требует 7,9 ГБ VRam, что позволяет использовать ее на большинстве стандартных видеокарт. В Zeroscope был использован офсетный шум в тысячах видеоклипов и кадров с тегами. Этот подход улучшает модель и ее способность генерировать разнообразные и реалистичные видеоролики на основе текстовых описаний.
Разработчик «Cerspense» считает, что Zeroscope - прямой конкурент коммерческой модели Gen-2 от Runway ML, которая преобразует текст в видео. Благодаря тщательной настройке и удалению водяных знаков, Zeroscope предлагает жизнеспособную альтернативу с открытым исходным кодом, которая полностью бесплатна для публичного использования. Gen-2 Runway остается ведущим коммерческим вариантом, но появление Zeroscope означает появление первой высококачественной нейросети с открытым исходным кодом.