Базы переводов и глоссарии (готовые/под заказ)

1. Про базы под заказ

Эта услуга/продукт для тех, кому надо быстро запустить работу по новому переводческому проекту и при этом прошлые наработки в заданной тематике или области.

Вообще, если прошлые переводы выполнялись в так называемых «кошках» — CAT tools, computer-assisted translation tools — то проблем нет, переводческие базы ( равно как и глоссарии) можно просто подключать к программе/платформе, и последняя будет «подтягивать» прошлые формулировки или термины.

Вопрос. Как быть, если такие наработки есть, но хранятся они в раздельных файлах: оригиналы отдельно, переводы отдельно?

Ответ. Можно переработать корпус текстов самостоятельно или с нашей помощью.

В частности, мы можем:

  1. Подготовить базу переводов в универсальном для переводческих программ/платформ формате (TMX) или удобном для самообучения формате (Excel).
  2. Подготовить глоссарий наиболее часто встречающихся терминов (с переводом), дополнительно.

Обе услуги мы выполняем в полуручном режиме, по возможности, с использованием специализированного ПО и средств автоматизации (Python/NLP).

Общий принцип использования готовых баз переводов

Стоимость услуги: от 1000 руб. за час / от 3 руб. за предложение / от 10 руб. за термин.

 

2. Про готовые базы

Также у нас в продаже есть готовые базы переводов, которые мы либо неэксклюзивно/неконфиденциально делали для других клиентов, либо для своих задач*.

Список готовых баз переводов с описаниями приведены ниже.
Цена за сегмент: 2,0 руб. (при покупке более 5 тыс. сегментов — 1,5 руб.).
По запросу, для демонстрации качества базы можем делать тестовую выгрузку не более 5% от размера базы. 

 

Как получить?

Оплачиваете базу по тарифу на любую карту, привязанную к телефону +79039550466 (Евгений Викторович Б.), чек и коды баз присылаете на эл. почту bartov-e@yandex.ru или в телеграм https://t.me/bartov_e. В ответ я высылаю базы в формате Excel и TMX.

Домен: ИТ
ID Тема. ПодтемаЯзыковая параКол-во предложенийИсточник Некоторые ключевые слова из TM
ro-ml-01 Машинное обучение. Распознавание именованных сущностей (Named Entity Recognition). EN, RU 91 EN: https://www.altexsoft.com/blog/named-entity-recognition/ (2023)
RU: Куцев, Роман
алгоритмы, SVM, Decision Trees, CRF, токенизация, признаки, морфологические признаки, синтаксические признаки, семантические признаки, классификация, правила, паттерны, трансферное обучение, активное обучение, spaCy, NLTK, Stanford NLP, NeuroNER, DeepPavlov, BRAT, API, Google Cloud NLP, Amazon AWS Comprehend, IBM Watson NLU, глубокое обучение, нейросети, архитектуры, трансформеры, GPT, RoBERTa.
ro-ml-02 Машинное обучение. Дата-майнинг. EN, RU 67 EN: https://www.altexsoft.com/blog/data-mining/
RU: Куцев, Роман
дата-майнинг, план, данные, источники данных, очистка данных, преобразование данных, моделирование, оценка, точность, надежность, валидность, развертывание, отчет, рекомендации, циклическая природа, предиктивный дата-майнинг, классификация, регрессия, анализ временных последовательностей, дескриптивный дата-майнинг, кластеризация, обобщение, ассоциативные правила, деревья решений, выявление аномалий, модели глубокого обучения, сегментация клиентов, управление рисками, прогнозирование оттока клиентов, анализ эмоционального настроя, прогнозирование спроса, Python, Pandas, NumPy, Scikit-learn, Google Charts, Grafana, инструменты.
mi-dvlp-01 Разработка ПО. Фронтенд, пользовательские интерфейсы EN, RU 52 https://haweepalash.medium.com/designing-the-future-how-front-end-development-is-revolutionizing-user-interfaces-2daa667db280, перевод на Хабр HTML, CSS, JavaScript, фронтенд-разработчики, бэкенд-разработчики, веб-разработка, клиентская сторона, серверная сторона, базы данных, интерфейс, тестирование, фреймворки, библиотеки, кроссбраузерность, контроль версий, DOM, React, Angular, Vue, Node.js, jQuery, Express, клиент-серверная архитектура, HTTP-запрос, HTTP-ответ
Домен: Медицина
ID ПодтемаЯзыковая параКол-во предложенийИсточник Некоторые ключевые слова из TM
mr-med-01 Офтальмология. Воспалительные и инфекционные заболевания конъюнктивы EN, RU 55 Color Atlas & Synopsis of Clinical Ophtalmology. Cornea // Christopher J. Rapuano, 2012 блефарит, мейбомиит, воспаление, глаза, инфекция, ресницы, конъюнктивы, кератопатия, халязион, припухлость, биопсия, конъюнктивит, гнойное отделяемое, аденовирусный, хламидийный, трахома, моллюск, деревянистая болезнь, гиперчувствительность, кератоконъюнктивит, рубцевание, роговица, атопический, щитовидная железа, хлопающий век, акне розацеа, сальные железы, телеангиэктазии, папулы, пустулы, ринофима, гранулемы, отек.
mr-med-02 Офтальмология. Дегенерации и опухоли конъюнктивы EN, RU 110 Color Atlas & Synopsis of Clinical Ophtalmology. Cornea // Christopher J. Rapuano, 2012 этиологические признаки, ультрафиолет, дегенерация, конъюнктивы, пролиферация, фиброваскулярная ткань, пингвекула, птеригиум, линия Стокера, роговица, фиксация, краевой кератит, амилоидоз, кальций, меланомы, халязион, гранулема, саркоидоз, риноспоридиоз, васкулит, дермоид, папиллома, карцинома, киста, гемангиома, фистула, каротидно-кавернозный синус, синус твёрдой мозговой оболочки, врожденное состояние.тивит, гнойное отделяемое, аденовирусный, хламидийный, трахома, моллюск, деревянистая болезнь, гиперчувствительность, кератоконъюнктивит, рубцевание, роговица, атопический, щитовидная железа, хлопающий век, акне розацеа, сальные железы, телеангиэктазии, папулы, пустулы, ринофима, гранулемы, отек.
nk-me-01 Физиология человека. Организм как замкнутая система регулирования. Рефлекс DE, RU 58 Physiologie des Menschen // Robert F. Schmidt, 1993 процессы, регуляция, нервная система, эндокринная система, гомеостаз, теория управления, теория информации, кибернетика, рефлексы, регуляторные процессы, обратная связь, управляемая переменная, регулятор, эффектор, возмущения, следящие системы, рефлекс растяжения, длина мышцы, спинной мозг, рефлекторный тонус, эффектор, знаки, обратная связь.
Домен: Химия
ID ПодтемаЯзыковая параКол-во предложенийИсточник Некоторые ключевые слова из TM
be-ch-01 Лакокрасочные материалы: состав и применение EN, RU 408 EN: Paint and surface coatings / R Lambourne, 1999
RU: Л. Н. Машляковский, А. М. Фрост, Е. А. Фрост, И. А. Луковский, В. Ю. Репкин, А. И.Ярцев
нитроцеллюлоза, взрывчатые вещества, химия, химическая промышленность, пигменты, красители, диоксид титана, лакокрасочные материалы, связующие, грунтовка, промежуточный слой, верхний слой, укрывистость, цвет, глянец, адгезия, механические свойства, физические свойства, долговечность, полимеры, смолы, алкиды, уретаны, аминосмолы, фенольные смолы, эпоксиды, полиэфиры, хлорированные каучуки, водные латексы, растворители, разбавители, краски, порошковые краски, кратерообразование, сморщивание, натеки, всплывание пигментов, изменение цвета, добавки, противоосадители, коллоидная устойчивость.
be-ch-02 Органические пленкообразователи EN, RU 592 EN: Paint and surface coatings / R Lambourne, 1999
RU: Л. Н. Машляковский, А. М. Фрост, Е. А. Фрост, И. А. Луковский, В. Ю. Репкин, А. И.Ярцев
полифункциональные мономеры, гександиолдиакрилат, триметилолпропан-триакрилат, акрилаты, метакрилаты, аллильные, винильные, фотоинициаторы, свободные радикалы, ароматические кетоны, кетоны, амины, эпоксидные смолы, аминокислоты, ангидриды дикарбоновых кислот, кислые полиэфиры, кислоты, полиэфиры, меламиноформальдегиды, блокированные изоцианаты, полиэфирные композиции, гидроксилсодержащие полиэфиры, меламиноформальдегид, триглицидилизоцианурат, найлон, поливинилхлорид, ацетат, бутират целлюлозы, полиэтилен, суспензии, электроосаждение
be-ch-03 Добавки в краски EN, RU 128 EN: Paint and surface coatings / R Lambourne, 1999
RU: Л. Н. Машляковский, А. М. Фрост, Е. А. Фрост, И. А. Луковский, В. Ю. Репкин, А. И.Ярцев
цинк, твердость, пленка, барий, кальций, сиккативы, законодательные ограничения, токсичность, системы сиккативов, свинец, цирконий, кобальт, токсичность, растворители, эфиры гликолей, электростатическое распыление, ржавчина, флеш-коррозия, ингибиторы, цветные краски, миграция пигментов, вязкость, регулирующие добавки, силиконсодержащие продукты, биоциды, плесень, зеленоватые морские водоросли, инсектициды, пропиточные композиции, древесина, УФ-излучение, выцветание пигментов, светостабилизаторы, антивспениватели, специфические добавки
WordPress Tables

* Все переводы для баз взяты из публично доступных материалов. Если мы нарушаем ваши авторские права, сообщите нам на bartov-e@yandex.ru

3. Часто задаваемые вопросы

  • MS Word считает предложением даже отдельное слово  с точкой. А что вы в контексте базы переводов понимаете под предложением? Не получится ли так, что я куплю Translation Memory на 500 предложений, а в ней 300 «предложений» будут просто слова с точками из какой-нибудь таблицы? 

Нет, мы прекрасно понимаем, что отдельные слова вы сможете абсолютно бесплатно посмотреть в любом онлайн-словаре типа Multitran или Lingvo. Мы в базу добавляем только полные предложения, и не добавляем туда заголовки, данные из таблиц, и даже полные предложения, которые не имеют отношения к тематике базы. 

  •  Если честно, пока не очень понятно, где вообще применять эти базы. Можете пояснить подробнее?

Без проблем. Из нашего опыта такие базы используются для решения следующих задач: 

  1. Для ускоренного запуска переводческих проектов в бюро переводов / отделах переводов в организациях.
  2. Для удобного изучения тематики переводчиками-студентами и профильными специалистами.
  3. Для ускоренного вхождения в тематику и набора терминов — устными переводчиками (например, при подготовке к выставке).
  4. Для исследовательских работ (для всяких курсовых и дипломных, ибо поиск нормальной базы предложений по заданной тематике — это отдельный увлекательный квест).
  5. В качестве обучающей выборки для движков машинного обучения в алгоритмах обучения с учителем. 
  6. Ну и классика: для разработки тематических глоссариев.
  • Как вы проверяете качество баз? Не получится ли так, что я куплю базу, а там на всю главу 3 полезных термина, а остальное — досужие рассуждения о том, что такое хорошо и что такое плохо?  

  1. Если база вам не подойдет, мы вернем деньги, тут проблем нет.
  2. Мы не берем в работу «пустые», абстрактные тексты (главы), тексты без спецтерминов. К таким текстам мы относим разделы, где автор благодарит коллег, делает вступительное слово, рассуждает на отвлеченные темы или в целом говорит общими словами.  Только мясо, только хардкор :).