Компьютерный лингвист

Автор: Артём Орлов
Обновлено
Компьютерный лингвист

Компьютерный лингвист разрабатывает алгоритмы распознавания звучащей и письменной речи, QA-систем, систем машинного перевода, создает инструменты для разработки чат-ботов, голосовых ассистентов и т. д. Профессия подходит тем, кому одновременно нравится изучать и языки – иностранные и русский, литературу, и математику с информатикой. Для входа в профессию нужно получить высшее образование. Кстати, недавно центр профориентации ПрофГид разработал точный тест на профориентацию, который сам расскажет, какие профессии вам подходят, даст заключение о вашем типе личности и интеллекте. Профессия подходит тем, кого интересует математика, иностранные языки и русский язык и литература (см. выбор профессии по интересу к школьным предметам).

Содержание:
Читайте также :

Краткое описание

Компьютерная лингвистика – это наука с множеством прикладных направлений. Самое крупное связано с обработкой больших данных – Big Data. В Интернете есть терабайты текстов в новостных лентах, соцсетях. Из них надо буквально выуживать определенную информацию, например, отслеживать тематические инфоповоды, чтобы предлагать в рекомендациях публикации, соответствующие вкусам пользователя.

Компьютерная лингвистика помогает решить огромное количество других, не менее важных задач. Компьютерные лингвисты принимают участие в создании алгоритмов и программ, которые используются:

  • для извлечения разного рода данных (определенная лексика, формы слов и др.) из огромного массива текстовой информации;
  • разработки онлайн-словарей, переводчиков;
  • создания голосовых помощников;
  • проектирования QA-систем;
  • обеспечения безопасности в Интернете и т. д.

Например, алгоритмы распознавания естественно звучащей речи используются в системах умных домов, современных гаджетах. Такие технологии облегчают жизнь обычных пользователей и людей с ограниченными возможностями. К созданию всем известных онлайн-переводчиков и редакторов текста (Word) тоже приложили руку компьютерные лингвисты. В том, что реклама в Интернете выдает вам объявления, исходя из истории вашего поиска, тоже есть их «заслуга».  

  • Подготовься к ЕГЭ, ОГЭ с нуля на максимум за 8,5 месяцев!
    Подготовься к ЕГЭ, ОГЭ с нуля на максимум за 8,5 месяцев!
    Команда Умскул сделает всё, чтобы вы успешно сдали экзамены и достигли своих целей. Успейте записаться до конца лета с 10% скидкой!
  • Подготовка к ЕГЭ 2023: видеокурсы без воды
    Подготовка к ЕГЭ 2023: видеокурсы без воды
    В 15 раз дешевле репетитора

Особенности профессии

Компьютерный лингвист обрабатывает данные на языках алгоритмов машинного обучения – чаще всего это Python, R, Java, JavaScript, C++. Например, отмечает в больших массивах текстов верные и ошибочные варианты употребления слов, создает тезаурусы для поисковых систем и электронные словари. После этого за дело берутся датасайентисты и разработчики, чтобы машины научились распознавать человеческие языки и автоматически переводить с одного на другой, находить ошибки в текстах, преобразовывать устную речь в письменную, вести диалоги в чат-ботах, откликаться на голосовые команды.  

Общее у компьютерных и естественных языков то, что это знаковые системы. Компьютерному лингвисту надо уметь одинаково хорошо работать сразу с двумя и видеть точки их пересечения.

Компьютерные лингвисты работают в связке с датасайентистами и девелоперами, которые пользуются данными, размеченными лингвистами. Поэтому им надо не просто обрабатывать текстовые данные – им нужно формировать методологию, разъяснять коллегам ее принципы. Для этого пригодятся навыки межпрофессиональной коммуникации.

Деятельность компьютерных лингвистов имеет важное социальное значение, ее результаты применяются в сфере Artificial Intelligence, машинного обучения, Big Data.  

Что делает компьютерный лингвист

В зависимости от места работы компьютерный лингвист может:

  • участвовать в создании QA-систем и алгоритмов развития искусственного интеллекта;
  • разрабатывать программы, которые имитируют познавательную языковую деятельность человека: умение читать, воспринимать на слух, говорить, поддерживать диалог, переводить с разных языков;
  • создавать алгоритмы систематизации текстов по разным признакам;
  • разрабатывать программы для поиска в текстах определенной информации;
  • программировать генераторы текстов;
  • создавать электронные словари, библиотеки и другие базы хранения лексических и языковых единиц;
  • разрабатывать алгоритмы оценки качества машинного перевода, проверки орфографии, сравнения текстов для поиска плагиата и т. д.

Компьютерные лингвисты могут быть аналитиками. Например, применяя алгоритмы обработки текста, они собирают информацию о разных объектах и на основании тональности реакций пользователей в отзывах, постах определяют, нравится новый фильм или нет, за кого на выборах проголосуют пользователи «Твиттера».

Читайте также :

Плюсы и минусы профессии

Плюсы:

  1. Профессия новая, поэтому кадровый рынок пока испытывает дефицит компьютерных лингвистов.
  2. Интересная творческая работа.
  3. Специалисты, обладающие хорошей базой знаний, могут найти работу в крупнейших компаниях. В них заинтересованы Google, «Яндекс», VK (Mail.ru Group) и другие технологические холдинги.
  4. Компьютерные лингвисты разбираются в двух совершенно разных областях – ИТ и прикладном языкознании. При желании они могут сменить сферу деятельности: уйти в программирование или перевод, цифровую журналистику, маркетинг.
  5. Работа хорошо оплачивается.
  6. В ближайшие несколько десятков лет компьютерная лингвистика будет динамично развиваться.
  7. Работодатели оказывают компьютерным лингвистам содействие во всех вопросах, связанных с повышением квалификации, обучением.
Читайте также :

Минусы:

  1. Компьютерная лингвистика – непростая прикладная наука, для работы нужна длительная подготовка.
  2. Немногие могут быть сразу и гуманитариями до мозга костей, и продвинутыми программистами. Работа компьютерного лингвиста предполагает именно такой трудно достижимый симбиоз. 
  3. Деятельность связана с работой за компьютером, поэтому лингвисты подвержены риску ряда профессиональных заболеваний: проблемы со зрением, опорно-двигательным аппаратом.

Важные личные качества

Компьютерные лингвисты – это гуманитарии и технари в одном лице. Они педантичны, к работе относятся скрупулезно и с программистской системностью. Обладают логическим мышлением, умением концертировать внимание, усидчивостью, склонностью к активной командной работе. Еще надо уметь выживать в условиях вечной многозадачности. 

Обучение на компьютерного лингвиста

Для входа в профессию надо пройти подготовку в вузе по направлению «Фундаментальная и прикладная лингвистика» (код: 45.03.03). Профильные ЕГЭ для этой специальности: русский и иностранный язык. Еще на выбор нужно сдавать экзамены по математике, литературе, обществознанию или информатике. Обучение можно продолжить, в магистратуре. Например, в НИУ «ВШЭ» открыта магистерская программа «Компьютерная лингвистика». «Чистые» лингвисты могут пройти дополнительную подготовку на курсах, связанных с AI, ML (машинное обучение, искусственный интеллект) и другими смежными ИТ-областями.

Вузы

Лучшие вузы для компьютерных лингвистов

  1. НИУ ВШЭ.
  2. РГГУ.
  3. МГУ им. М. В. Ломоносова.
  4. ДВФУ.
  5. УрФУ.
  6. НГУ.
  7. ЮУрГУ (НИУ).
  8. СГУ им. Н. Г. Чернышевского.
  9. ВГУ.
  10. КубГУ.
Читайте также :

Лучшие курсы

  1. Skillbox.
  2. GeekBrains.

Место работы

В компьютерных лингвистах заинтересованы IT-агентства, а также крупные компании, деятельность которых связана с созданием инновационных продуктов и технологий, поисковыми системами, проведением лингвистической экспертизы, хранением и обработкой данных. Специалисты могут найти работу в НИИ, аналитических агентствах и т. д.

Заработная плата

Размер заработной платы зависит от опыта компьютерного лингвиста, его способностей, склонности к постоянному обучению и статуса компании, в которой он работает. Специалист обладает глубокими знаниями в разных областях, поэтому может увеличить свой доход, выполняя переводы, лингвистические экспертизы и другие задачи.

Зарплата компьютерного лингвиста на август 2022

Информации о зарплатах предоставлена порталом hh.ru.

Россия 25000—50000₽
Москва 90000—140000₽

Профессиональные знания

  1. Лингвистика.
  2. SQL. 
  3. Математические модели в лингвистике.
  4. Языки программирования (Python, Ruby и другие).
  5. Машинное обучение, искусственный интеллект и нейросети.
  6. Иностранные языки (желательно не только английский).
Читайте также :

Примеры компаний с вакансиями компьютерного лингвиста

  • Лингвист-разработчик
  • Бизнес-ассистент (английский язык)
  • Младший рекрутер в сфере Video Games и Art
  • Лингвист / Аналитик
  • Младший рекрутер в сфере Video Games и Art
star_rate star_rate star_rate star_rate star_rate