Создать тему  Создать ответ 
Латынь.бел
04-04-2016, 21:29    
Сообщение: #1
Agrest

井蛙 / жабенєтко в керниці
Сообщений: 1556
Зарегистрирован: 08.08.12

 
Хочу представить общественности Латынь.бел — онлайн-версию латинско-русского словаря Мусселиуса, которой я занимался в свободное время последний месяц. Её создание отчасти стало результатом темы Поиск в сканированных словарях.

В той теме я высказывал мнение, что индекс для сканированных словарей — это суррогат полностью оцифрованной версии:

(20-09-2014 23:22)Agrest писал(а):  По моему разумению, наши индексы сами по себе представляют суррогат по отношению к полностью проиндексированному (т.е. где записано каждое слово) и полностью OCR'ному виду.

Этот принцип положен в основу латынь.бел: поиск по индексу используется для тех слов, для которых нет нормально набранной версии. Таким образом, пользоваться словарём можно уже сейчас, но показ слова как картинки — временная мера.

Кроме того, наличие оцифрованной версии обусловлено техническими причинами:
  • Картинки передавать дороже. Поэтому я планирую сначала добавить самые популярные слова, чтобы картинки запрашивались реже. Хотя, конечно, для каждого слова есть возможность свериться со сканом (ссылка «факсимиле» внизу каждого слова).
  • Словарь въ дореформенной орѳографіи, поэтому кроме индекса нужно думать про яти и фиту. Если же слова оцифрованы, то этот вопрос решается тривиально. Я стараюсь начинать оцифровку именно со слов с ятем.

Я планирую сделать возможность набирать и вычитывать словарь по принципу вики, всем желающим. Более далёкие (и сложные!) планы — сделать обновлённую редакцию словаря в современной орфографии (с полуавтоматическим преобразованием), а также сделать аналогичный сайт для C&CELD и, возможно, для каких-то других словарей в свободном доступе.

В принципе, мне уже нравится то, что получается на сайте. Поисковые запросы можно делать, просто введя в адресной строке латынь.бел/слово — по-моему это легко запомнить и использовать.

Буду рад комментариям, пожеланиям и т.п.

«билингв мусорит в обоих языках — и первом, и втором» © Python
Вебсайт Найти все сообщения
Цитировать это сообщение
06-04-2016, 09:11    
Сообщение: #2
Bʰudʰ

Member
Сообщений: 188
Зарегистрирован: 23.10.12

RE: Латынь.бел
Кроме самых популярных слов, можно по-быстрому оцифровать самые короткие словарные статьи (в пределе: одно слово-перевод).
В качестве теста я ввёл слово «кора» и получил
Цитата:Словарь открыт на слове кора (если такое слово в словаре есть). В оцифрованном виде такого слова нет, поэтому показываем скан.
И на огромном скане где-то в середине написано
Цитата:Кора cortex.

Исполнитель роли Терминатора по решению суда сменил фамилию на Афроамериканоафроамериканец.
В противном случае артисту грозил штраф в $1.723 млрд.
Найти все сообщения
Цитировать это сообщение
06-04-2016, 21:13    
Сообщение: #3
Agrest

井蛙 / жабенєтко в керниці
Сообщений: 1556
Зарегистрирован: 08.08.12

RE: Латынь.бел
Можно и их. Хотя мне кажется, что искать на огромном скане «кора» — всё-таки не настолько неудобно, как искать «лѣто» на странице с «летать», где его банально нет.

Я более приоритетным вижу сейчас сделать инфраструктуру, чтобы редактировать слова могли все. Сейчас какое-то редактирование уже есть, но не хватает ведения истории (и её отображения). Ещё нужно какое-то обсуждение слов, комментирование, сообщения об ошибках.

«билингв мусорит в обоих языках — и первом, и втором» © Python
Вебсайт Найти все сообщения
Цитировать это сообщение
11-10-2016, 21:33    
Сообщение: #4
Agrest

井蛙 / жабенєтко в керниці
Сообщений: 1556
Зарегистрирован: 08.08.12

RE: Латынь.бел
В словаре уже пять тысяч набранных слов (где-то треть). Словом №5000 стало выражать.

«билингв мусорит в обоих языках — и первом, и втором» © Python
Вебсайт Найти все сообщения
Цитировать это сообщение
05-08-2019, 22:46    
Сообщение: #5
Denis21

Junior Member
Сообщений: 2
Зарегистрирован: 05.08.19

RE: Латынь.бел
Спасибо, интересно глянуть)
Вебсайт Найти все сообщения
Цитировать это сообщение
Создать ответ 


Переход:


Пользователи просматривают эту тему: 1 Гость(ей)