1. Онлайн-инструменты, ориентированные на документацию
Среди онлайн-инструментов, ориентированных на документацию, можно выделить несколько групп, различающихся функционально и структурно. Это онлайн-архивы с различными уровнями доступа и системой навигации, программное обеспечение для анализа языковых данных, платформы и приложения для собственно документации, корпусные платформы для развертывания текстовых корпусов, информационные ресурсы с коллекциями языковых материалов, с удобным и простым интерфейсом, а также некоторые более узкозадачные инструменты.
1.1. Архивы
Специализированные онлайн-архивы вносят ключевой вклад в сохранение и распространение языковых данных. Архивы, с одной стороны, являются важными участниками рабочего процесса документации в качестве ресурса по систематизации и хранению собранных материалов [Nathan 2008, 2011]. С другой стороны, они становятся источниками языковых данных, которые могут быть использованы для различных целей, как научных, так и ревитализацонных. Так, на основе данных другие специалисты могут проводить свои исследования. Вместе с тем, на основе документационных материалов можно создавать учебные материалы и приложения, контент на языке, а также различные цифровые инструменты. Соответственно, языковые архивы, как и другие научные цифровые хранилища, создаются с ориентацией на две основные аудитории. Это хранители языковых данных, которые могли бы занести их в архив, и различные потенциальные пользователи этих материалов: исследователи (лингвисты и другие), языковые сообщества, студенты, преподаватели, художники и т. д.
Многие архивы работают над тем, чтобы пользоваться ими становилось более удобно: развивают интуитивно понятный интерфейс, удобную систему навигации и систему метаданных, позволяющие легко находить необходимую информацию [Yi et al. 2022, Nathan 2010, Sullivant 2020]. Так, в исследовании [Burke et al. 2022] предоставляются эмпирические данные о потребностях пользователей языковых архивов и рассказывается об известных проблемах, с которыми сталкиваются менеджеры языковых архивов, люди, готовые внести материал в архив, и конечные пользователи. В последние года четко осознается потребность в том, чтобы к языковым архивам имели легкий доступ представители языковых сообществ [Panigrahi 2022]. Необходимо выработать такую систему, при которой академические архивы, обладающие возможностями долговременного хранения, становились бы более доступными и открытыми площадками. Тогда языковые активисты будут обеспечены надежным местом для хранения тех данных, которые они собирают, а представители языковых сообществ — примерами использования их языков. Например, архив «Коренные языки Америки» (англ. Native American Languages, NAL (сайт архива)) (Оклахомский университет, США) при разработке онлайн-платформы для своего цифрового архива сразу закладывает в необходимые качества простоту использования и доступность для представителей языковых сообществ. В докладе [Heaton and Hooshiar 2022], посвященном этим разработкам, рассказывается о серии воркшопов, проведенных в 2020 году, в которых, совместно с представителями коренного населения Оклахомы, т.е. будущими пользователями онлайн-платформы, обсуждались основные вопросы, связанные с ее функционированием. Среди них основными были вопросы навигации в системе, возможность и механизм пополнения, условия сотрудничества между архивом и теми, кто хочет внести в архив свои данные.
1.2. Работа с метаданными
Большую долю работы с языковыми данными, в том числе собранными в ходе документационных проектов, составляет организация материалов. Только структурированным архивом можно пользоваться. Структура архива строится на метаданных к материалам. Сейчас не существует единой системы метаданных, которой следовали бы все, кто занимается документацией. В архивах есть свои выработанные правила, но они отличаются друг от друга. Если же брать личные коллекции, то разнообразия тут еще больше. Опрос, проведенный австралийским исследовательским центром CoEDL (англ. Centre of Excellence for the Dynamics of Language ‘Центр передового опыта в области динамики языка’) в начале 2016 года, дал около 135 ответов и показал, что большинство ответивших исследователей не используют существующие инструменты для организации метаданных, а полагаются на электронные таблицы, текстовые документы или ручку и бумагу. Для унификации метаданных, облегчения и частичной автоматизации работы с ними разрабатываются различные приложения и инструменты. В том числе это очень актуально для удаленной документации, когда участники проекта находятся далеко друг от друга и, может быть, не общаются напрямую. Унификация метаданных необходима для того, чтобы создавать архивы с прозрачной навигацией и доступом к различным коллекциям языковых данных по всему миру.
1.3. Программное обеспечение для лингвистического анализа
С развитием технологий в документационной лингвистике развивались и технические способы анализа языковых данных, кроме того, появились и вошли в стандарт документации и медиаформаты (аудио и видео), что потребовало новых решений. Если изначально разбор текста, например, велся с помощью какого-либо текстового редактора, то сейчас разработаны гораздо более удобные программы, ориентированные именно на лингвистические задачи. Важной чертой этих программ является совместимость форматов, в которых можно экспортировать проанализированные материалы.
1.4. Платформы и приложения для собственно документации
Активные разработки архивных онлайн-платформ и онлайн-инструментов для доступной документации вместе со стремлением к развитию новых взаимоотношений между лингвистами и представителями небольших языковых сообществ и к поддержке документационных проектов, инициированных изнутри сообщества, приводит к созданию инструментов, ориентированных как на сбор языковых данных, так и на хранение и обеспечение доступа к ним.
1.5. Корпусные платформы
Важную роль в документационном процессе играет создание корпуса проанализированных текстов. Такой корпус позволяет широко использовать записанные в каком-либо проекте данные и проводить корпусные исследования различных тематик. Для того, чтобы представлять такой корпус в сети Интернет и обеспечивать возможность онлайн работы с ним, создаются корпусные платформы. Изначально они создавались для академических нужд, но сейчас разработчики учитывают необходимость одновременного представления текстов как для членов языковых сообществ, так и для всех интересующихся. Кроме того, корпусные платформы доступны бесплатно и с открытым кодом, так что каждый может доработать функционал под свои задачи.
1.6. Коллекции документационных материалов для широкой аудитории
Кроме доступных архивов и корпусов видится важным разрабатывать платформы, на которых пользователи смогут познакомиться с языком и культурой какого-либо сообщества в удобной форме. Материалами для таких сайтов могут стать документационные материалы в аудио- и видеоформате, снабженные расшифровкой и переводом. На данный момент ресурсов, где в такой форме были бы представлены именно собранные в ходе документации данные, мало. Это в том числе связано с проблемами с персональными данными и информированным согласием участников исследования на обработку и распространение своих данных, в том числе видеоизображения и другой личной информации. В то же время, кажется, что ценность и востребованность таких ресурсов велика, и это мотивирует научное сообщество решать возникающие этические и юридические вопросы.
1.7. Использование архивных материалов
Немаловажной задачей как документации, так и лингвистики в целом является изучение письменных памятников языка ранних времен. Часто такие памятники хранятся в архивах, если и в оцифрованном виде, то в формате изображения. Таким образом, поиск нужных текстов напрямую по их содержанию невозможен. Чтобы это стало возможным, изображение с текстом (а часто это рукописный текст) необходимо превратить в файл в текстовом формате. Над автоматизацией этой задачи давно ведется работа, в том числе и со стороны разработчиков-лингвистов.
2. Онлайн-инструменты для овладения языком
Изучение языка с помощью компьютера (англ. Computer-aided language learning, CALL) начало зарождаться еще в середине прошлого века и с тех пор существенно продвинулось благодаря стремительному развитию информационных технологий. В настоящее время существуют сотни программ для изучения языка. Некоторые из них не просто используют компьютер как средство обучения, но опираются на современные достижения в области корпусной лингвистики и автоматической обработки языка. Такие системы могут быть названы интеллектуальными обучающими системами.
В этой области можно выделить сферу изучения языка с помощью мобильных устройств (англ. Mobile-Assisted Language Learning, MALL), опирающуюся на мобильные технологии. Основные характеристики мобильного обучения (m-learning) заключаются в том, что процесс обучения является персонализированным, спонтанным, неформальным и повсеместным. Хотя обучение с помощью мобильных телефонов может занять больше времени по сравнению с компьютерами, учащиеся чувствуют большую свободу в выборе времени и места. В отличие от традиционного обучения, в MALL учащимся не нужно присутствовать в классе или находиться за компьютером для участия в учебном процессе.
Приведем обзор некоторых исследований по данной проблематике. В работе [Miangah, Nezarat 2012] обсуждаются преимущества и недостатки, связанные с использованием мобильных технологий как для студентов, так и для профессионалов. Авторы рассматривают следующие области изучения языка с помощью мобильных устройств: словарный запас, аудирование, грамматику, фонетику и понимание прочитанного. В работе [Koole, Lewis 2020] поднимается глобальный вопрос о необходимости рассмотрения точки зрения коренных народов в технологическом образовании. В статье [Cassels, Farr 2019] авторы исследуют более узкую тему — использование мобильных приложений для изучения языков коренных народов. В работе приводятся обзор соответствующей литературы по теме и обзор 32 приложений, предназначенных для поддержки усилий по возрождению языков коренных народов в Канаде и на материковой части США. В работе [Begay 2013] исследуются новые разработки в области мобильных технологий и то, как они используются в сообществах коренных народов для изучения и преподавания языков. На основе анализа четырех мобильных приложений с помощью выработанных критериев оценки, онлайн-отзывов пользователей и консультаций с разработчиками автор определяет, какие основные темы важны при разработке эффективной и успешной модели языкового приложения. В статье [Ovide, García-Peñalvo 2016] авторы описывают проект по изучению языка вичи (Аргентина), который включает в себя преподавание и изучение языка, совместную работу над языком вичи и создание мобильного приложения для изучения основ языка.
2.1. Работа с текстами
Обучение языку часто включает в себя работу с текстами, которая может строиться на разных методиках, что позволяет практиковать определенные языковые компетенции. В этом разделе представлены онлайн-инструменты, реализующие некоторые из таких методик.
2.2. Словари
Неотъемлемым атрибутом обучения языку является, конечно же, словарь. Современные электронные словари далеко ушли по удобству и функционалу от печатных. А словари, доступные на мобильных устройствах, делают процесс обучения наиболее гибким. Кроме того, создание таких словарей сейчас доступно широкой аудитории, причем в основе могут лежать разные источники: как изданные словари, так и словари, собранные в ходе документационных проектов. Процесс оцифровки, распознавания и форматирования печатных словарей может быть полностью автоматизирован. Данные, полученные в результате обработки документационных материалов различными лингвистическими инструментами, также позволяют автоматически создавать мобильный словарь.
2.3. Языковые курсы
Кроме отдельных компонентов процесса обучения языку, в приложениях могут быть реализованы комплексные языковые курсы для самостоятельного изучения языка. Сейчас такие курсы чаще всего построены на основе коммуникативного подхода и задействуют такие технологии, как автоматическое распознавание и порождение речи, машинное обучение. Далее приведем несколько наиболее популярных примеров таких приложений.
2.4. Инструменты для учителей
В этом разделе представлены некоторые инструменты для преподавания языков, которыми могут воспользоваться учителя. Эти инструменты не специфичны для миноритарных языков, они могут использоваться в преподавании любого языка.
3. Онлайн-инструменты для создания контента на языке
Для сохранения и развития языков важно расширять сферы их функционирования, если в каких-то из них язык не используется. Использование языков в онлайн-пространстве уже давно стало привычным, но далеко не все языки широко в нем представлены или вообще используются. В то же время обеспечение такой возможности для всех языков является важной задачей в ревитализационных процессах.
3.1. Инфраструктура
Чтобы языки были представлены в цифровом формате и в онлайн среде, важно создавать необходимые для этого составляющие, например, шрифты и раскладки клавиатуры. Эти задачи все больше и больше становятся доступны пользователям компьютеров без специального образования благодаря разработкам удобных инструментов и распространению обучающих видео об их использовании. Таким образом, все больше возможностей получают представители языковых сообществ для реализации своих инициатив по созданию нужных элементов цифровой среды самостоятельно.
3.2. Контент и общение на языке в сети Интернет
Наличие контента и общения на языке в сети Интернет, является естественным для широко распространенных языков. В то же время, для небольших языковых сообществ эта сфера может быть не охвачена. Таким образом, требуются дополнительные целенаправленные усилия для того, чтобы увеличивать представленность языка в сети Интернет за счет создания оригинального контента или перевода уже существующего. Во многих случаях в языковых сообществах есть активный запрос на это. Современные технологии делают и этот процесс все более доступным для широкого круга людей, заинтересованных в поддержке и развитии своих языков. Остановимся на некоторых примерах доступных возможностей.