Елена Будянская
- Техника с подключением к сети Интернет
- Тексты на языке в видео- или аудиоформате
- Аккаунт на платформе YouTube у всех участников проекта
- Программное обеспечение: ELAN (при необходимости)
Платформа YouTube доступна и популярна среди всех пользователей сети Интернет и, таким образом, является удачным инструментом для сохранения и развития языков, которым могут пользоваться как лингвисты, так и языковые активисты и представители языковых сообществ без специального образования. С одной стороны, это доступная возможность увеличивать представленность языка в сети Интернет, создавать контент на языке, расширять сферы функционирования языка. Вместе с тем, это удобный инструмент для удаленной документации, с помощью которого можно расшифровывать и переводить тексты, что является этапом подготовки лингвистического корпуса.
В сентябре 2021 года Программа по документации исчезающих языков (англ. Endangered Languages Documentation Programme, сокр. ELDP) организовала серию воркшопов, посвященных различным аспектам дистанционной работы, на которых лингвисты делились своим опытом проведения удаленных проектов в 2021 году. Один из воркшопов был посвящен использованию возможностей платформы YouTube для создания перевода и субтитров представителями сообщества («YouTube as a transcription and translation tool», ведущий Александр Райс). На этом воркшопе участники могли научиться создавать субтитры и перевод, а также интегрировать эту практику в рабочий процесс удаленной документации.
Использование платформы YouTube для расшифровки или перевода текстов в аудио- или видеоформате имеет много достоинств. С одной стороны, не нужно устанавливать никакого программного обеспечения и разбираться в его функционале. Кроме того, возможность работать на YouTube не зависит от операционной системы компьютера или ноутбука. При этом достаточно не самого стабильного и скоростного соединения с сетью Интернет. Если есть возможность просматривать видеосюжеты на платформе YouTube, то получится и создавать субтитры. Есть возможность совместной работы над одним проектом, хоть и не одновременно. Вдобавок созданные таким образом субтитры можно легко сделать доступными сообществу.
Однако есть и ряд ограничений, которые частично можно «обойти». Средствами платформы YouTube сложно сделать точную сегментацию аудиопотока. Если есть такая необходимость, то можно это поправить после, например, в программе ELAN. Или там же подготовить разбивку на сегменты заранее. Кроме того, платформа YouTube не дает возможности создавать несколько слоев аннотации, чтобы различать разных говорящих, если их в тексте несколько. В то же время, можно создать отдельные файлы с субтитрами для каждого из говорящих. Некоторым техническим ограничением можно назвать недостаточность смартфона для работы в Творческой студии YouTube. Кроме того, стоит соблюдать некоторые меры безопасности, если вы не планировали распространять ваши материалы в открытом доступе. Важно выставить правильный уровень доступа при загрузке файла («Ограниченный доступ»), выходить из аккаунта при завершении рабочей сессии с общественного компьютера и удалить видео после завершения проекта.
В общих чертах процесс расшифровки и перевода текста выглядит следующим образом. Сначала необходимо загрузить видео на свой YouTube-канал (не забыв ограничить к нему доступ). Разбираться в настройках загрузки видео не обязательно, можно оставлять выставленные по умолчанию. После завершения загрузки нужно перейти в раздел редактирования видео и выбрать в меню слева опцию «Субтитры». Если YouTube создал автоматические субтитры, попытавшись распознать язык текста, их можно удалить. Добавляя субтитры, необходимо выбрать язык, при этом нужного языка в списке может не оказаться, тогда лучше выбрать какой-то редкий язык, чтобы YouTube не создал снова автоматические субтитры. В открывшемся окне для создания субтитров нужно выбрать опцию «Ввести вручную» и снизу появится таймлайн, а слева возможность добавлять аннотации. YouTube автоматически формирует сегмент длительностью в 2 секунды, что можно менять. В появившемся сверху слева пространстве нужно напечатать расшифровку выделенного фрагмента. Далее можно проигрывать видео до следующего момента с речью и, остановив, создать новую аннотацию. И так далее. Чтобы завершить рабочую сессию и сохранить работу, нужно нажать «Сохранить черновик». А если работа над субтитрами завершена, можно нажать «Опубликовать». После этого можно приступать к созданию второго слоя субтитров, например, с переводом. При этом в окне редактирования откроются уже созданные субтитры с сегментацией и расшифровкой, что сделает процесс перевода более удобным. После публикации созданных субтитров появляется возможность их скачать в формате srt. Файлы этого формата при необходимости можно использовать для создания слоев аннотации в программном обеспечении ELAN.
Весь описанный выше процесс пошагово продемонстрирован на видеозаписи упомянутого воркшопа ELDP на английском языке. Кроме того, за консультацией можно обратиться к сотруднице Научного центра Елене Будянской.