Aluarium
Латынь.бел - Версия для печати

+- Aluarium (http://aluarium.net/forum)
+-- Форум: Наука и техника (/forum-46.html)
+--- Форум: Компьютеры (/forum-50.html)
+--- Тема: Латынь.бел (/thread-1234.html)



- Agrest - 04-04-2016 21:29

Хочу представить общественности Латынь.бел — онлайн-версию латинско-русского словаря Мусселиуса, которой я занимался в свободное время последний месяц. Её создание отчасти стало результатом темы Поиск в сканированных словарях.

В той теме я высказывал мнение, что индекс для сканированных словарей — это суррогат полностью оцифрованной версии:

(20-09-2014 23:22)Agrest писал(а):  По моему разумению, наши индексы сами по себе представляют суррогат по отношению к полностью проиндексированному (т.е. где записано каждое слово) и полностью OCR'ному виду.

Этот принцип положен в основу латынь.бел: поиск по индексу используется для тех слов, для которых нет нормально набранной версии. Таким образом, пользоваться словарём можно уже сейчас, но показ слова как картинки — временная мера.

Кроме того, наличие оцифрованной версии обусловлено техническими причинами:
  • Картинки передавать дороже. Поэтому я планирую сначала добавить самые популярные слова, чтобы картинки запрашивались реже. Хотя, конечно, для каждого слова есть возможность свериться со сканом (ссылка «факсимиле» внизу каждого слова).
  • Словарь въ дореформенной орѳографіи, поэтому кроме индекса нужно думать про яти и фиту. Если же слова оцифрованы, то этот вопрос решается тривиально. Я стараюсь начинать оцифровку именно со слов с ятем.

Я планирую сделать возможность набирать и вычитывать словарь по принципу вики, всем желающим. Более далёкие (и сложные!) планы — сделать обновлённую редакцию словаря в современной орфографии (с полуавтоматическим преобразованием), а также сделать аналогичный сайт для C&CELD и, возможно, для каких-то других словарей в свободном доступе.

В принципе, мне уже нравится то, что получается на сайте. Поисковые запросы можно делать, просто введя в адресной строке латынь.бел/слово — по-моему это легко запомнить и использовать.

Буду рад комментариям, пожеланиям и т.п.


RE: Латынь.бел - Bʰudʰ - 06-04-2016 09:11

Кроме самых популярных слов, можно по-быстрому оцифровать самые короткие словарные статьи (в пределе: одно слово-перевод).
В качестве теста я ввёл слово «кора» и получил
Цитата:Словарь открыт на слове кора (если такое слово в словаре есть). В оцифрованном виде такого слова нет, поэтому показываем скан.
И на огромном скане где-то в середине написано
Цитата:Кора cortex.



RE: Латынь.бел - Agrest - 06-04-2016 21:13

Можно и их. Хотя мне кажется, что искать на огромном скане «кора» — всё-таки не настолько неудобно, как искать «лѣто» на странице с «летать», где его банально нет.

Я более приоритетным вижу сейчас сделать инфраструктуру, чтобы редактировать слова могли все. Сейчас какое-то редактирование уже есть, но не хватает ведения истории (и её отображения). Ещё нужно какое-то обсуждение слов, комментирование, сообщения об ошибках.


RE: Латынь.бел - Agrest - 11-10-2016 21:33

В словаре уже пять тысяч набранных слов (где-то треть). Словом №5000 стало выражать.


RE: Латынь.бел - Denis21 - 05-08-2019 22:46

Спасибо, интересно глянуть)